1. Analyser les intégrations audio pour caractériser les caractéristiques vocales
2. Détecter les points de changement de locuteur au fil du temps
3. Regrouper les segments par similarité de locuteur
4. Attribuer des identifiants de locuteur stables à chaque segment