Ir al contenido principal

Árbol de Abstracción Jerárquico para RAG Multi-Documento | Cómo estructurar información de múltiples archivos para recuperación inteligente | Mejora de RAG para consultas complejas sobre colecciones de documentos extensos

Cross-Document RAGárboles jerárquicos de abstracciónHAT architecture_RAGrecuperación semántica avanzadamultidocument retrievalcontext management AIRAG avanzado

Abstract

PROBLEMA: Los sistemas RAG tradicionales sufren al intentar sintetizar información que reside en múltiples documentos extensos, perdiendo a menudo el contexto macroscópico o relaciones jerárquicas. SOLUCIÓN: Se propone HAT (Hierarchical Abstract Tree), una estructura que organiza los documentos en un árbol de resúmenes y abstracciones para facilitar la navegación semántica. METODOLOGÍA: El sistema procesa los documentos creando resúmenes locales que se agregan en niveles superiores de abstracción, permitiendo que el LLM recupere solo la rama del árbol relevante para la consulta. RESULTADOS: HAT reduce drásticamente el ruido en el contexto de entrada y mejora la precisión en tareas de síntesis multidocumento en comparación con bases de vectores planas. RELEVANCIA: Es crucial para aplicaciones de análisis legal, médico o técnico donde las respuestas requieren unir piezas de información dispersas en grandes bibliotecas.

Escríbenos por WhatsApp
Asesor VirtualAsesor Virtual 24h