AI News

La infraestructura de NVIDIA y Google reduce los costes de inferencia de IA

12 de mayo de 2026

En la conferencia Google Cloud Next, Google y NVIDIA han detallado su hoja de ruta de hardware para abordar los costes de inferencia de IA a gran escala. Han presentado las nuevas instancias A5X bare-metal en sistemas NVIDIA Vera Rubin NVL72, que logran hasta diez veces menor coste por token y mayor rendimiento por megavatio. Se abordan retos como la soberanía de datos mediante cómputo confidencial en Google Distributed Cloud y VMs G4. Además, facilitan el entrenamiento de sistemas IA agentivos con plataformas como Gemini Enterprise Agent y NeMo RL. Estas soluciones optimizan infraestructuras para IA física, robótica y simulaciones industriales, beneficiando a empresas como OpenAI y Schrödinger.

NVIDIAGoogle Cloudinferencia IABlackwellIA agentivasoberanía de datosIA física

Leer noticia original

Volver a Noticias IA

WhatsApp con nuestro agente IAEscríbenos y te atiende nuestro agente IA de WhatsApp. Es una demo real: el mismo que montamos para clientes.Llama y habla con nuestra IA de vozLlámanos al 941 72 25 19 y resuelve tus dudas por teléfono hablando con nuestra IA de voz. Otra demo real, funcionando.