インタビューやポッドキャストでの話者のラベル付け
複数の話者のビデオでの会話の正しい帰属
字幕の読みやすさと構造の改善
下流の翻訳および編集ワークフローのサポート
コンテンツに単一の話者のみが含まれている場合
話者が明確な分離なしに継続的に重なる場合
手動の話者ラベル付けがすでに利用可能な場合