1. Extraire le texte à l'écran des diapositives à l'aide de l'OCR
2. Détecter les limites des diapositives et les zones de diapositives actives
3. Fournir le texte de la diapositive comme guide contextuel au moteur de reconnaissance vocale
4. Aligner la parole transcrite avec la structure au niveau de la diapositive