Memex(RL): Escalado de Agentes LLM de Horizonte Largo mediante Memoria de Experiencia Indexada
Long-horizon agentsLLM memory indexingReinforcement LearningExperience RetrievalAgentic Systems
Abstract
Memex(RL) presenta un marco innovador para escalar agentes basados en modelos de lenguaje (LLM) en tareas de horizonte largo mediante el uso de una memoria de experiencia indexada. A diferencia de los enfoques tradicionales que saturan el contexto del modelo, este sistema permite que el agente almacene, indexe y recupere de forma selectiva trayectorias y estados pasados, mejorando drásticamente la consistencia en tareas que requieren razonamiento secuencial prolongado. El estudio demuestra cómo el refuerzo de estas capacidades de indexing permite al agente aprender de sus propios éxitos y fallos pasados para optimizar la toma de decisiones futura en entornos dinámicos complejos.