Ir al contenido principalSaltar al contenido
Hugging Face Blog

AstroBERT Small: Modelos pequeños especializados en un dominio

Este artículo presenta la nueva serie de modelos AstroBERT Small, un modelo pequeño de 22.7M de parámetros con un rendimiento sólido, entrenado en resúmenes de ArXiv categorizados como "astro-ph" y artículos de Wikipedia relacionados con la astronomía. Estos modelos demuestran que la especialización en un dominio estrecho requiere menos parámetros que los modelos generalizados para todos los problemas. El modelo base se ha entrenado utilizando masked language modeling y se ha ajustado para generar incrustaciones vectoriales mediante destilación de embeddings del modelo Qwen3-Embedding-8B. AstroBERT Small Embeddings supera significativamente a modelos de tamaño similar y a algunos más grandes en los resultados de evaluación, siendo eficiente para configuraciones solo con CPU.

AstroBERT Smallmodelos de lenguajeNeuMLHugging FaceArXivWikipediaembeddings
Leer noticia original
Asesor Virtual 24h - Abre el chat para consultasAsesor Virtual 24h
Hablar por WhatsApp con nuestro agenteLlámanos al teléfono