16 de marzo de 2026

Steve-Evolving: Auto-Evolución de Agentes Embodied mediante Diagnóstico de Errores y Destilación Dual

Embodied AI OutdoorSelf-EvolutionKnowledge Distillation_Dual-TrackOpen-World LearningAutonomous Diagnosis

Abstract

Steve-Evolving presenta un marco para el aprendizaje autónomo y la auto-evolución de agentes integrados (embodied) en entornos de mundo abierto. El sistema utiliza una arquitectura de diagnóstico de grano fino que permite al agente identificar específicamente por qué falló una tarea (por ejemplo, error de percepción vs. error de planificación motora). Una de las innovaciones clave es la 'Destilación de Conocimiento de Doble Vía' (Dual-Track Knowledge Distillation), donde el agente aprende simultáneamente de demostraciones de expertos y de sus propias experiencias exitosas, ponderando la confianza en cada fuente según la incertidumbre del entorno. El modelo demuestra una capacidad superior para adaptarse a cambios en la dinámica del entorno (como variaciones en la gravedad o fricción en simulaciones) sin intervención humana. Este enfoque de auto-corrección y aprendizaje continuo es fundamental para el despliegue de robots y agentes en escenarios desconocidos donde los datos de entrenamiento preexistentes son insuficientes.

Leer paper original

Volver a Papers IA