No. Los hablantes se etiquetan genéricamente (por ejemplo, Hablante 1, Hablante 2) a menos que se cambie el nombre manualmente.
El habla superpuesta se admite parcialmente, pero la precisión puede reducirse según la calidad del audio.
No. Todo el análisis de hablantes se realiza localmente.