12 de mayo de 2026

Escalado de cómputo en inferencia mediante sinergia multi-agente | Cómo resolver problemas difíciles usando varios agentes en paralelo al razonar | Estrategia de colaboración dinámica para mejorar la precisión de LLMs en tiempo real

Test-Time ComputeCómputo en tiempo de pruebaMulti-Agent SynergySinergia multi-agenteInference ScalingEscalado de inferenciaProblem solving agents

Abstract

PROBLEMA: El rendimiento de los LLMs está limitado por su cómputo fijo durante la inferencia; aunque existen métodos como Chain-of-Thought, a menudo no aprovechan la colaboración para tareas extremadamente difíciles. SOLUCIÓN: Se propone TMAS (Scaling Test-Time Compute via Multi-Agent Synergy), un marco donde múltiples agentes especializados colaboran dinámicamente para refinar respuestas en tiempo real durante la inferencia. METODOLOGÍA: Implementa un protocolo de comunicación y votación ponderada donde los agentes evalúan las premisas del otro, ajustando el tiempo de procesamiento según la dificultad detectada de la tarea. RESULTADOS: TMAS demuestra que el escalado horizontal (más agentes colaborando) es más eficiente que el escalado vertical en tiempo de prueba para tareas de razonamiento matemático y lógico. RELEVANCIA: Ofrece un nuevo paradigma para alcanzar niveles de inteligencia superior sin necesidad de modelos gigantes, simplemente optimizando cómo se usa el cómputo al responder.

Leer paper original

Volver a Papers IA