1. Agrupar los tiempos de ejecución de inferencia y procesamiento requeridos localmente
2. Ejecutar modelos de voz, visión y traducción en el dispositivo
3. Gestionar recursos y tuberías sin llamadas de red
4. Persistir todos los resultados intermedios y finales localmente