Arquitectura DAWN de Modelos Interactivos Mundo-Acción | Integración de políticas de acción en modelos de mundo | Nuevos paradigmas para agentes robóticos con percepción y razonamiento integrado
Abstract
PROBLEMA: Existe una desconexión entre los modelos que entienden el mundo (world models) y los que ejecutan acciones (policy models), lo que limita la adaptabilidad en entornos reales. SOLUCIÓN: El paper presenta DAWN, un modelo interactivo que integra la comprensión del entorno con la política de acción en un único espacio latente. METODOLOGÍA: El modelo fue entrenado con datos de interacción multimodal, permitiéndole predecir no solo el siguiente estado del mundo, sino también la acción óptima para alcanzar una meta. RESULTADOS: DAWN superó a los modelos modulares en tareas de manipulación robótica compleja y navegación en entornos no estructurados, mostrando una mayor robustez ante cambios en la escena. RELEVANCIA: Representa un paso adelante hacia la IA física o 'Embodied AI' donde el razonamiento y la acción son inseparables.