Ir al contenido principal
Hugging Face

DenseOn con LateOn: Modelos abiertos de estado del arte de un solo vector y multi-vector

LightOn AI ha lanzado DenseOn y LateOn, dos familias de modelos de recuperación abiertos que superan los state-of-the-art en el benchmark BEIR para modelos multi-vector (ColBERT) y de un solo vector (dense). Estos modelos de 149 millones de parámetros se basan en ModernBERT y se entrenaron con grandes datasets abiertos curados mediante pipelines de filtrado no destructivos y fine-tuning con hard negatives minados. Se liberan todos los modelos, checkpoints intermedios, datasets de pre-entrenamiento y fine-tuning, así como herramientas como PyLate y FastPLAID. Los experimentos en BEIR descontaminado confirman que las mejoras se deben a generalización genuina y no a fugas de datos. Esta liberación democratiza el acceso a modelos de recuperación de alto rendimiento para la comunidad open source.

LightOn AIDenseOnLateOnColBERTBEIRModernBERTrecuperación de información
Leer noticia original
Escríbenos por WhatsApp
Asesor VirtualAsesor Virtual 24h