Length Value Model: Pre-entrenamiento de Valor para Modelado de Longitud | Cómo controlar la extensión de las respuestas de IA a nivel de token | Optimización de la longitud de salida en modelos de lenguaje grande
Abstract
PROBLEMA: Los LLMs actuales tienen dificultades para controlar o predecir con precisión la longitud de las respuestas que generarán, lo que afecta la planificación de recursos y la experiencia del usuario. SOLUCIÓN: Se propone el Length Value Model (LVM), un enfoque de pre-entrenamiento de valor escalable diseñado para modelar la longitud esperada de la secuencia a nivel de cada token generado. METODOLOGÍA: Implementan una arquitectura de 'value head' que se entrena junto al modelo base para estimar el número de tokens restantes, permitiendo una decodificación guiada por presupuesto de longitud. RESULTADOS: El modelo demuestra una mejora del 35% en el cumplimiento de restricciones de longitud y una reducción significativa en la latencia de inferencia al evitar sobre-generación. RELEVANCIA: Crucial para aplicaciones de LLM con restricciones estrictas de presupuesto, resúmenes de longitud fija y sistemas de tiempo real.