12 de mayo de 2026

Gestión dinámica del ciclo de vida de habilidades para RL agéntico | Cómo optimizar el repertorio de habilidades de un agente autónomo | Framework para la evolución y depuración de capacidades en agentes inteligentes

Skill ManagementGestión de habilidadesAgentic RLAprendizaje por refuerzo agénticoLifecycle managementReinforcement LearningAgentes autónomos

Abstract

PROBLEMA: En el aprendizaje por refuerzo agéntico, los agentes a menudo acumulan demasiadas habilidades redundantes o fallan al adaptar habilidades antiguas a nuevos contextos, lo que degrada la eficiencia de la política. SOLUCIÓN: Se propone un marco de gestión dinámica del ciclo de vida de las habilidades (Dynamic Skill Lifecycle Management) que permite a los agentes crear, refinar y retirar habilidades basándose en su utilidad y frecuencia de uso. METODOLOGÍA: El sistema utiliza un mecanismo de evaluación basado en el éxito de la tarea y la novedad del estado para catalogar habilidades en una biblioteca dinámica, optimizando la política de selección de acciones. RESULTADOS: Los experimentos muestran una mejora del 40% en la velocidad de convergencia en entornos complejos y una mayor capacidad de transferencia de tareas en comparación con baselines de RL jerárquico. RELEVANCIA: Proporciona una base para agentes más autónomos y eficientes que pueden evolucionar sus capacidades sin intervención humana constante.

Leer paper original

Volver a Papers IA