LLaTiSA: Razonamiento de series temporales mediante estratificación de dificultad | Cómo mejorar la percepción visual y semántica de datos temporales en LLMs | Marco para el análisis avanzado de tendencias cronológicas con modelos multimodales
Abstract
PROBLEMA: La mayoría de los modelos de lenguaje multimodales actuales presentan dificultades al razonar sobre series temporales, fallando en integrar la percepción visual de los datos con el análisis semántico profundo necesario para tareas complejas. SOLUCIÓN: El paper presenta LLaTiSA, un marco de trabajo diseñado para el razonamiento de series temporales estratificado por dificultad, que entrena al modelo para progresar desde la percepción visual básica hasta la comprensión semántica avanzada. METODOLOGÍA: Los autores proponen una estrategia de instrucción que separa las tareas en niveles de dificultad y un conjunto de datos curado que desafía al modelo tanto en la identificación de patrones visuales como en la inferencia lógica. RESULTADOS: LLaTiSA demuestra una mejora significativa en la precisión de las predicciones y explicaciones cualitativas en comparación con modelos base como GPT-4V en benchmarks de series temporales. RELEVANCIA: Es fundamental para sistemas RAG que manejan datos financieros, operativos o espaciales donde la interpretación de tendencias históricas es crítica.