EvoArena: Seguimiento de la evolución de la memoria en agentes LLM | Cómo mejorar la robustez de agentes en entornos dinámicos | Evaluación de la persistencia y actualización de memoria en modelos de lenguaje agénticos
Abstract
PROBLEMA: Los agentes basados en LLM suelen tener dificultades en entornos dinámicos donde la información cambia con el tiempo, lo que provoca fallos en la persistencia de la memoria y en la actualización de conocimientos obsoletos. SOLUCIÓN: El paper presenta EvoArena, un framework diseñado específicamente para rastrear y evaluar cómo evoluciona la memoria de los agentes en escenarios competitivos y cooperativos cambiantes. METODOLOGÍA: Utilizan una arena de simulación donde los agentes deben adaptar sus estrategias basándose en un flujo continuo de observaciones, midiendo la retención, el olvido selectivo y la corrección de errores. RESULTADOS: Los experimentos demuestran que la mayoría de los agentes actuales fallan al reconciliar información contradictoria nueva con recuerdos previos, y proponen mecanismos de "limpieza de memoria" para mejorar la robustez. RELEVANCIA: Es fundamental para el desarrollo de sistemas agénticos que operan en el mundo real, donde la coherencia temporal es crítica para la toma de decisiones.