Familia Darwin: Fusión Evolutiva para Escalar Razonamiento sin Entrenamiento | Cómo combinar LLMs existentes para mejorar su capacidad lógica | Método MRI para la mezcla óptima de modelos de lenguaje pre-entrenados
Abstract
PROBLEMA: Escalar las capacidades de razonamiento de un LLM usualmente requiere un reentrenamiento costoso o un fine-tuning masivo. SOLUCIÓN: La familia Darwin utiliza un enfoque de fusión evolutiva ponderada por confianza (MRI) para combinar múltiples modelos especializados sin entrenamiento adicional. METODOLOGÍA: Se aplica un algoritmo evolutivo que selecciona y mezcla pesos de diferentes modelos basándose en una métrica de 'confianza' en la respuesta, optimizando la capacidad de razonamiento final. RESULTADOS: Los modelos resultantes superaron a sus precursores en benchmarks de razonamiento matemático y de código, demostrando un escalado 'gratuito' de capacidades. RELEVANCIA: Ofrece una vía eficiente para mejorar modelos existentes mediante la combinación inteligente de sus fortalezas en lugar de empezar desde cero.