Recuperación de errores inducidos por la política: Robustez en agentes de GUI | Mejora de la resiliencia en agentes autónomos de software | Benchmark y síntesis de trayectorias para agents IA autorecuperables
Abstract
PROBLEMA: Los agentes que operan en interfaces gráficas (GUIs) fallan catastróficamente ante cambios inesperados o errores en pasos intermedios sin capacidad de autorrecuperación. SOLUCIÓN: Proponen un benchmark y un método de síntesis de trayectorias diseñado específicamente para entrenar a los agentes a detectar, corregir y recuperarse de errores inducidos por su propia política. METODOLOGÍA: Generan miles de escenarios de fallo sintéticos donde el agente debe re-planificar su ruta de acción tras una acción fallida. RESULTADOS: Los agentes entrenados con este método muestran un incremento del 35% en la tasa de éxito en tareas de navegación de software complejas y de larga duración. RELEVANCIA: Vital para la creación de agentes autónomos confiables que puedan interactuar con aplicaciones del mundo real sin supervisión humana constante.