CoVe: Entrenamiento de Agentes Agénticos de Uso de Herramientas mediante Verificación Guiada por Restricciones
Abstract
CoVe (Constraint-Guided Verification) presenta un marco de entrenamiento innovador para agentes LLM que utilizan herramientas, centrándose en la interactividad y la auto-corrección. A diferencia de los métodos tradicionales que dependen únicamente de la retroalimentación del entorno, CoVe implementa un sistema de verificación basado en restricciones explícitas que el agente debe validar antes de dar por finalizada una tarea. El paper detalla cómo el uso de verificadores intermedios reduce significativamente las alucinaciones de llamadas a APIs y mejora la precisión en tareas largas donde un error inicial suele propagarse catastróficamente. Los experimentos muestran que los agentes entrenados con CoVe superan a GPT-4 en tareas de razonamiento con herramientas externas mediante el aprendizaje de trayectorias donde el fallo es analizado y corregido de forma autónoma. Es una contribución esencial para el desarrollo de sistemas de agentes autónomos confiables en entornos de producción donde la precisión de las operaciones es mandataria.