Atelier « MistralOCR » 23/01/2026
Le 4e atelier numérique de l’ObTIC-IHN aura lieu le 23 janvier 2026 à la BnF, Paris.
Titre : Exploiter Mistral OCR – Extraction et structuration de documents (PDF/images)
Public concerné : débutants souhaitant s’initier à l’OCR et à l’extraction structurée pour des documents d’archives (ou autres).
Date : 23/01/2026 (14h–17h)
Lieu: BnF (salle 70), Quai François Mauriac, 75706 Paris
Animateurs : Idris Hachi, Floriane Chiffoleau, Alina Miasnikova (ObTIC, SU)
Résumé:
Cet atelier a pour objectif d’initier à l’usage de Mistral OCR pour convertir des PDF/scans/images en contenus exploitables (texte, mise en page, tableaux, équations) et structurés.
Après une introduction (qualité des sources, paramètres, limites et bonnes pratiques), les participants réaliseront des travaux pratiques : préparation d’un document, lancement de l’OCR, récupération des résultats (export texte/Markdown/JSON selon les sorties disponibles), contrôle qualité, puis pistes d’intégration dans une chaîne de traitement (indexation, recherche, RAG, préparation d’édition numérique).
Pré-requis : ordinateur portable, un PDF ou des images de document à tester (facultatif mais recommandé).
Lien : Google Colab
Inscriptions : Merci de remplir ce formulaire pour vous inscrire à cet atelier. Vous serez contacté(e) pour confirmer votre inscription.