1. Convertir les sous-titres ou le texte du script en segments de narration
2. Sélectionner le modèle vocal et les paramètres de parole par segment
3. Synthétiser l'audio localement pour chaque bloc de narration
4. Aligner la narration générée avec les timestamps de la chronologie