2 de julio de 2026

Domain Arithmetic: Adaptación One-Shot de modelos VLA | Aritmética de dominios para robustez robótica ante cambios de entorno | Cómo generalizar acciones de robots mediante ajustes latentes rápidos

VLA modelsOne-Shot AdaptationDomain Arithmetic Labrobótica operativamodelos de mundoVisual-Language-Actiongeneralización robótica

Abstract

PROBLEMA: Los modelos Vision-Language-Action (VLA) suelen fallar cuando se despliegan en entornos ligeramente diferentes a los de entrenamiento (cambios de iluminación, color del fondo o posición de cámara) debido a la rigidez de sus pesos. SOLUCIÓN: El paper introduce 'Domain Arithmetic', un método que permite la adaptación one-shot sin necesidad de un ajuste fino costoso. Utiliza una sola demostración o imagen del nuevo dominio para calcular un vector de desplazamiento en el espacio latente y ajustar la política de acción. METODOLOGÍA: Utilizan una arquitectura base OpenVLA y aplican operaciones aritméticas sobre los pesos de los 'low-rank adapters' (LoRA) especializados en dominios. Compararon el rendimiento en 12 tareas de manipulación en 5 entornos distintos. RESULTADOS: El método logra una tasa de éxito del 85% en entornos no vistos, superando al zero-shot tradicional (42%) y alcanzando un rendimiento comparable al fine-tuning completo pero con 1,000 veces menos datos. RELEVANCIA: Es un avance significativo para la robótica 'out-of-the-box', permitiendo que robots industriales o domésticos se adapten instantáneamente a su entorno específico.

Leer paper original

Volver a Papers IA