KARL: Agentes de Conocimiento Optimizados mediante Aprendizaje por Refuerzo para Recuperación Compleja
Abstract
KARL (Knowledge Agents via Reinforcement Learning) propone un nuevo enfoque para la creación de agentes de conocimiento que utilizan Aprendizaje por Refuerzo (RL) para optimizar sus estrategias de búsqueda y síntesis de información. A diferencia de los sistemas RAG estáticos, KARL entrena al agente para que aprenda qué información es relevante y cómo debe ser recuperada para maximizar la utilidad de la respuesta final. El agente actúa en un entorno donde las acciones son consultas de búsqueda o llamadas a herramientas de conocimiento, y la recompensa se basa en la precisión y completitud de la tarea razonada. Este método permite que los agentes se vuelvan expertos en dominios específicos de manera autónoma, refinando su comportamiento a través de la interacción. Es especialmente relevante para entornos donde la información es dinámica y el agente debe discernir entre datos contradictorios o desactualizados.