Thinking to Recall: El razonamiento como mecanismo de recuperación de memoria paramétrica en LLMs
Abstract
Este estudio investiga una capacidad emergente en los modelos de lenguaje de gran tamaño (LLMs) denominada 'Thinking to Recall'. A diferencia del uso tradicional de Chain-of-Thought (CoT) para descomponer problemas lógicos, los autores demuestran que el razonamiento intermedio puede actuar como un mecanismo para desbloquear y recuperar conocimientos paramétricos que el modelo no puede expresar mediante una respuesta directa. La investigación detalla cómo el proceso de razonamiento genera pistas contextuales internas que activan asociaciones de memoria más profundas. Los experimentos realizados con modelos de última generación muestran que, ante preguntas de conocimiento factual complejo, permitir que el modelo 'piense' antes de responder aumenta drásticamente la tasa de recuperación de datos precisos sin necesidad de herramientas externas (RAG). Este hallazgo sugiere que el conocimiento 'olvidado' o inaccesible en los pesos del modelo puede ser sistemáticamente extraído mediante estrategias de prompting orientadas a la introspección y la reconstrucción lógica.