Escalado de cómputo en inferencia mediante sinergia multi-agente | Cómo resolver problemas difíciles usando varios agentes en paralelo al razonar | Estrategia de colaboración dinámica para mejorar la precisión de LLMs en tiempo real
Abstract
PROBLEMA: El rendimiento de los LLMs está limitado por su cómputo fijo durante la inferencia; aunque existen métodos como Chain-of-Thought, a menudo no aprovechan la colaboración para tareas extremadamente difíciles. SOLUCIÓN: Se propone TMAS (Scaling Test-Time Compute via Multi-Agent Synergy), un marco donde múltiples agentes especializados colaboran dinámicamente para refinar respuestas en tiempo real durante la inferencia. METODOLOGÍA: Implementa un protocolo de comunicación y votación ponderada donde los agentes evalúan las premisas del otro, ajustando el tiempo de procesamiento según la dificultad detectada de la tarea. RESULTADOS: TMAS demuestra que el escalado horizontal (más agentes colaborando) es más eficiente que el escalado vertical en tiempo de prueba para tareas de razonamiento matemático y lógico. RELEVANCIA: Ofrece un nuevo paradigma para alcanzar niveles de inteligencia superior sin necesidad de modelos gigantes, simplemente optimizando cómo se usa el cómputo al responder.