1. Regrouper les runtimes d'inférence et de traitement requis localement
2. Exécuter des modèles de parole, de vision et de traduction sur l'appareil
3. Gérer les ressources et les pipelines sans appels réseau
4. Persister tous les résultats intermédiaires et finaux localement