CHIMERA: Datos Sintéticos Compactos para un Razonamiento de LLMs Generalizable de Alta Eficiencia
Abstract
CHIMERA presenta una metodología avanzada para la generación de datos sintéticos compactos diseñados para mejorar la capacidad de razonamiento generalizable en LLMs. Los autores identifican que el entrenamiento con grandes volúmenes de datos sintéticos de baja calidad a menudo conduce al colapso del modelo o a la memorización de patrones. CHIMERA utiliza un proceso de destilación y refinamiento iterativo para crear conjuntos de datos que son órdenes de magnitud más pequeños que los tradicionales pero que contienen una densidad de información lógica mucho mayor. El paper demuestra que entrenar modelos pequeños con estos datos 'compactos' les permite superar a modelos más grandes en tareas críticas de razonamiento lógico y matemático. Esta técnica es vital para el desarrollo de modelos de nicho altamente eficientes que requieren capacidades de inferencia avanzadas sin el coste computacional de los modelos de frontera masivos.