1. Échantillonner des images vidéo ou des pages de document à intervalles contrôlés
2. Détecter les zones de texte à l'aide de l'analyse de la mise en page visuelle
3. Reconnaître les caractères à l'aide de modèles OCR entraînés
4. Normaliser et structurer le texte extrait pour une utilisation en aval