Demo de Gemma 4 VLA en Jetson Orin Nano Super
Asier Arranz de NVIDIA presenta un tutorial para ejecutar un demo de Gemma 4 como agente de visión y lenguaje (VLA) de forma local en un Jetson Orin Nano Super de 8 GB. El flujo procesa el habla mediante Parakeet STT, pasa el texto a Gemma 4 que decide si necesita visión activando la webcam para capturar y analizar una imagen, y responde con Kokoro TTS. No usa disparadores de palabras clave ni lógica hardcoded; el modelo actúa basado en el contexto. Incluye instrucciones detalladas para hardware, paquetes, entorno Python, compilación de llama.cpp nativo, descarga de modelos GGUF y ejecución del script desde GitHub. Funciona con cuantizaciones Q4 para caber en la memoria limitada del dispositivo edge.
Gemma 4Jetson Orin Nano SuperVLANVIDIAllama.cppvisión-lenguajeedge AI
Leer noticia original