La infraestructura de NVIDIA y Google reduce los costes de inferencia de IA
En la conferencia Google Cloud Next, Google y NVIDIA han presentado su hoja de ruta de hardware para reducir los costes de inferencia de IA a gran escala. Han introducido instancias A5X bare-metal basadas en sistemas NVIDIA Vera Rubin NVL72, que ofrecen hasta diez veces menor coste por token y mayor rendimiento. Estas soluciones abordan desafíos de ancho de banda, escalabilidad hasta 960.000 GPUs y gobernanza de datos soberanos con cómputo confidencial. Además, facilitan el entrenamiento de IA agentica y simulaciones físicas para robótica e industria. Esto es relevante para optimizar costes, seguridad y sostenibilidad en despliegues empresariales de IA.
NVIDIAGoogle Cloudinferencia de IABlackwellIA agenticasoberanía de datosIA física
Leer noticia original