14 de mayo de 2026

Aprendizaje en Contexto de Muchos Ejemplos con CoT | Escalando Chain-of-Thought a miles de ejemplos en el prompt | Cómo mejorar el razonamiento de LLMs mediante aprendizaje en la inferencia

In-Context Learningaprendizaje en contextoMany-shot CoTrazonamiento masivoLLM optimizationoptimización de promptsscaling laws

Abstract

PROBLEMA: El aprendizaje en contexto (ICL) tradicional se limita a pocos ejemplos (few-shot), lo que a menudo impide que el modelo capte patrones de razonamiento extremadamente complejos. SOLUCIÓN: Introduce 'Many-Shot CoT-ICL', un método que aprovecha ventanas de contexto extendidas para incluir cientos o miles de ejemplos de cadena de pensamiento (Chain-of-Thought). METODOLOGÍA: Se realizaron pruebas extensivas escalando el número de demostraciones desde 10 hasta 2000 ejemplos, analizando cómo el modelo 'aprende' la tarea durante la inferencia. RESULTADOS: Se observó un aumento significativo en la capacidad de generalización en tareas de razonamiento simbólico y matemático, superando los límites previamente establecidos por el fine-tuning tradicional. RELEVANCIA: Este estudio redefine cómo diseñamos prompts para modelos de contexto largo y sugiere que la inferencia puede sustituir parcialmente al reentrenamiento.

Leer paper original

Volver a Papers IA