Co-evolución de decisiones y bancos de habilidades en agentes LLM | Framework para la resolución de tareas complejas de largo horizonte mediante agentes de IA | Cómo mejorar la autonomía y eficiencia de agentes en secuencias de tareas prolongadas
Abstract
PROBLEMA: Los agentes basados en LLM a menudo fallan en tareas de largo horizonte debido a una planificación ineficiente y a la falta de habilidades especializadas que puedan reutilizarse con éxito. SOLUCIÓN: El estudio propone un marco de co-evolución donde el módulo de toma de decisiones del agente y su banco de habilidades (Skill Bank) se optimizan mutuamente de forma iterativa hacia el éxito de la tarea. METODOLOGÍA: Se utiliza un proceso de aprendizaje reforzado y retroalimentación iterativa para refinar cómo el LLM selecciona acciones y cómo se construyen nuevas habilidades atómicas a partir de experiencias pasadas. RESULTADOS: El enfoque logra tasas de éxito drásticamente superiores en entornos de simulación complejos donde los agentes tradicionales se estancan tras pocos pasos. RELEVANCIA: Crucial para el desarrollo de agentes autónomos capaces de ejecutar flujos de trabajo prolongados en ingeniería, software o investigación científica.