いいえ。分析は、網羅的な物体分類ではなく、コンテンツ処理をサポートするコンテキスト要素に焦点を当てています。
いいえ。視覚的コンテキスト分析は、追加の信号を提供することで音声文字起こしを強化します。
いいえ。すべての視覚分析はローカルで実行されます。