EndoCoT: Escalado de Razonamiento Endógeno en Cadena de Pensamiento para Modelos de Difusión
Abstract
EndoCoT propone una transición fundamental en los modelos de difusión al integrar capacidades de Cadena de Pensamiento (CoT) de forma endógena. El estudio explora cómo escalar el razonamiento interno dentro del proceso de eliminación de ruido, permitiendo que el modelo genere pasos de pensamiento intermedios (no necesariamente textuales) que guíen la síntesis de contenido complejo. A diferencia de los métodos de razonamiento exógenos que dependen de LLMs externos, EndoCoT utiliza la propia arquitectura del modelo de difusión para 'reflexionar' sobre la estructura lógica de la tarea antes de la generación final. Los resultados demuestran que el escalado de estos pasos de razonamiento mejora drásticamente la fidelidad en tareas que requieren composición lógica y espacial, estableciendo un nuevo benchmark para la intersección entre modelos generativos y sistemas de razonamiento profundo.