LightThinker++: De la compresión del razonamiento a la gestión de memoria | Optimización de agentes mediante la reducción de trazas de pensamiento | Cómo gestionar la memoria en modelos de lenguaje con razonamiento profundo
Abstract
PROBLEMA: Los modelos de razonamiento (como Chain-of-Thought) generan trazas de pensamiento extensas que consumen tokens excesivos y dificultan la gestión de memoria en interacciones largas. SOLUCIÓN: LightThinker++ propone una arquitectura que comprime las etapas intermedias del pensamiento y las integra en un sistema de gestión de memoria dinámica para agentes. METODOLOGÍA: El sistema emplea un mecanismo de 'atención selectiva al pensamiento' que identifica qué pasos del razonamiento son esenciales para el objetivo final, descartando redundancias. RESULTADOS: Demuestra una reducción del 60% en la longitud del contexto de razonamiento con una pérdida de precisión inferior al 2% en tareas de lógica compleja. RELEVANCIA: Es un avance crítico para sistemas agénticos de 'ciclo continuo' (always-on) que necesitan mantener coherencia sin agotar los límites del modelo.