Solvita: Mejora de LLMs para programación competitiva mediante evolución agéntica | Sistema de agentes IA para resolución de retos complejos de código | Cómo entrenar modelos de programación mediante ciclos de autocrítica y evolución agéntica
Abstract
PROBLEMA: La programación competitiva requiere un nivel de abstracción y corrección que los LLMs estándar no alcanzan solo con fine-tuning supervisado. SOLUCIÓN: Se presenta Solvita, un sistema que utiliza un proceso de "evolución agéntica" donde múltiples agentes colaboran y compiten para iterar sobre soluciones de código, aprendiendo de los errores de ejecución. METODOLOGÍA: Implementa un ciclo de retroalimentación donde un agente crítico evalúa el desempeño de un agente programador en entornos de prueba reales, guiando la evolución del modelo mediante refuerzo. RESULTADOS: Solvita ha logrado establecer nuevos récords en plataformas como Codeforces entre modelos de su escala, demostrando que el enfoque agéntico supera al entrenamiento estático de modelos de código. RELEVANCIA: Este enfoque representa el futuro de la ingeniería de software asistida por IA, donde los modelos no solo generan código, sino que lo validan y mejoran autónomamente.