La infraestructura de NVIDIA y Google reduce los costes de inferencia de IA
En la conferencia Google Cloud Next, Google y NVIDIA han presentado su hoja de ruta de hardware para reducir los costes de inferencia de IA a gran escala. Han introducido instancias A5X bare-metal basadas en sistemas NVIDIA Vera Rubin NVL72, que ofrecen hasta diez veces menor coste por token y mayor rendimiento por megavatio. Estas soluciones abordan desafíos de ancho de banda, escalabilidad hasta 960.000 GPUs, gobernanza de datos soberanos, entrenamiento de IA agentic y simulaciones físicas para robótica e industria. La colaboración optimiza rendimiento, coste y sostenibilidad para cargas de trabajo avanzadas como modelos frontier y IA física.
NVIDIAGoogle Cloudinferencia IAVera RubinBlackwellIA agenticIA física
Leer noticia original