Ir al contenido principal
AI News

Infraestructura de NVIDIA y Google reduce los costes de inferencia de IA

En la conferencia Google Cloud Next, Google y NVIDIA han presentado su hoja de ruta de hardware diseñada para reducir los costes de inferencia de IA a gran escala. Han detallado las nuevas instancias A5X bare-metal en sistemas NVIDIA Vera Rubin NVL72, que ofrecen hasta diez veces menor coste por token y mayor rendimiento por megavatio. Esta arquitectura aborda desafíos de ancho de banda con ConnectX-9 SuperNICs y tecnología Virgo de Google, escalando hasta 960.000 GPUs. Además, incluyen soluciones para gobernanza de datos soberanos con cómputo confidencial, entrenamiento de IA agentic y simulaciones físicas con Omniverse. Estas avances permiten a las empresas optimizar rendimiento, coste y sostenibilidad en workloads de IA.

NVIDIAGoogle Cloudinferencia IABlackwellIA agenticsoberanía de datosIA física
Leer noticia original
Escríbenos por WhatsApp
Asesor VirtualAsesor Virtual 24h