Non. L'analyse se concentre sur les éléments contextuels qui soutiennent le traitement du contenu, et non sur la classification exhaustive des objets.
Non. L'analyse du contexte visuel augmente la transcription audio en fournissant des signaux supplémentaires.
Non. Toute l'analyse visuelle est effectuée localement.