Atelier « MistralOCR » 23/01/2026

Le 4e atelier numérique de l’ObTIC-IHN aura lieu le 23 janvier 2026 à la BnF, Paris.

Titre : Exploiter Mistral OCR – Extraction et structuration de documents (PDF/images)

Public concerné : débutants souhaitant s’initier à l’OCR et à l’extraction structurée pour des documents d’archives (ou autres).

Date : 23/01/2026 (14h–17h)

Lieu: BnF (salle 70), Quai François Mauriac, 75706 Paris

Animateurs : Idris Hachi, Floriane Chiffoleau, Alina Miasnikova (ObTIC, SU)

Résumé:
Cet atelier a pour objectif d’initier à l’usage de Mistral OCR pour convertir des PDF/scans/images en contenus exploitables (texte, mise en page, tableaux, équations) et structurés.
Après une introduction (qualité des sources, paramètres, limites et bonnes pratiques), les participants réaliseront des travaux pratiques : préparation d’un document, lancement de l’OCR, récupération des résultats (export texte/Markdown/JSON selon les sorties disponibles), contrôle qualité, puis pistes d’intégration dans une chaîne de traitement (indexation, recherche, RAG, préparation d’édition numérique).

Pré-requis : ordinateur portable, un PDF ou des images de document à tester (facultatif mais recommandé).

Lien : Google Colab

Inscriptions : Merci de remplir ce formulaire pour vous inscrire à cet atelier. Vous serez contacté(e) pour confirmer votre inscription.