1. Convertir texto de subtítulos o guiones en segmentos de narración
2. Seleccionar modelo de voz y parámetros de habla por segmento
3. Sintetizar audio localmente para cada bloque de narración
4. Alinear la narración generada con las marcas de tiempo de la línea de tiempo