Ir al contenido principalSaltar al contenido
Hugging Face Blog

Acelerando el ajuste fino de Transformers con NVIDIA NeMo AutoModel

NVIDIA NeMo AutoModel acelera el ajuste fino de modelos Transformer, especialmente los modelos Mixture-of-Experts (MoE), al integrarse con Transformers v5 de Hugging Face. Ofrece hasta 3.7 veces más rendimiento de entrenamiento y un 32% menos de memoria GPU. Esta optimización se logra mediante paralelismo de expertos (EP), el despachador DeepEP que fusiona comunicación con computación y el uso de kernels de TransformerEngine.

NVIDIA NeMo AutoModelTransformers v5ajuste finomodelos MoEparalelismo de expertosDeepEPTransformerEngine
Leer noticia original
Asesor Virtual 24h - Abre el chat para consultasAsesor Virtual 24h
Hablar por WhatsApp con nuestro agenteLlámanos al teléfono