Hugging Face Blog

Acelerando el ajuste fino de Transformers con NVIDIA NeMo AutoModel

26 de junio de 2026

NVIDIA NeMo AutoModel acelera el ajuste fino de modelos Transformer, especialmente los modelos Mixture-of-Experts (MoE), al integrarse con Transformers v5 de Hugging Face. Ofrece hasta 3.7 veces más rendimiento de entrenamiento y un 32% menos de memoria GPU. Esta optimización se logra mediante paralelismo de expertos (EP), el despachador DeepEP que fusiona comunicación con computación y el uso de kernels de TransformerEngine.

NVIDIA NeMo AutoModelTransformers v5ajuste finomodelos MoEparalelismo de expertosDeepEPTransformerEngine

Leer noticia original

Volver a Noticias IA