AI News

Infraestructura de NVIDIA y Google reduce los costes de inferencia de IA

11 de mayo de 2026

En la conferencia Google Cloud Next, Google y NVIDIA han detallado su hoja de ruta de hardware para abordar los costes de inferencia de IA a gran escala. Han presentado las nuevas instancias A5X bare-metal basadas en sistemas NVIDIA Vera Rubin NVL72, que logran hasta diez veces menor coste por token y mayor rendimiento por megavatio. Esta arquitectura resuelve desafíos de ancho de banda con ConnectX-9 SuperNICs y tecnología Virgo, escalando hasta 960.000 GPUs. Además, incluyen soluciones para gobernanza de datos soberanos, entrenamiento de IA agentic y simulaciones físicas en industrias como la manufactura.

NVIDIAGoogle Cloudinferencia IABlackwellVera RubinIA agenticrobótica física

Leer noticia original

Volver a Noticias IA

WhatsApp con nuestro agente IAEscríbenos y te atiende nuestro agente IA de WhatsApp. Es una demo real: el mismo que montamos para clientes.Llama y habla con nuestra IA de vozLlámanos al 941 72 25 19 y resuelve tus dudas por teléfono hablando con nuestra IA de voz. Otra demo real, funcionando.