NVIDIAとGoogle Cloudが提携し96万基のVera Rubin搭載ベアメタルサーバーを提供へ – GIGAZINE

NVIDIAが、次世代のエージェント型AIおよび物理AIを推進するAIファクトリー向けにGoogle Cloud AI Hypercomputerを拡張することを発表しました。最大で96万基のRubin GPUまでスケール可能なNVIDIA Vera Rubin搭載の「A5X」インスタンスを企業が利用できるようになります。

NVIDIA and Google Cloud Collaborate to Advance Agentic and Physical AI | NVIDIA Blog
https://blogs.nvidia.com/blog/google-cloud-agentic-physical-ai-factories/

.@GoogleCloud and NVIDIA are expanding their partnership across agentic and physical AI.

At #GoogleCloudNext, the companies made several announcements, including:

✅ NVIDIA Vera Rubin-powered A5X instances, scaling up to nearly 1M Rubin GPUs
✅ Gemini on Google Distributed… pic.twitter.com/5RxjUtfRJl
— NVIDIA (@nvidia) April 22, 2026

新たに発表された「A5X」はNVIDIA Vera Rubin NVL72ラックスケールシステムを採用したベアメタルインスタンスです。ベアメタルインスタンスとは、仮想サーバーではなく物理サーバー単体を一社が独占利用できるシステムを指します。

A5Xは前世代と比べてトークンあたりの推論コストが最大10分の1に削減され、メガワットあたりのトークンスループットが最大10倍に向上しているとのこと。ネットワーキングシステム「NVIDIA ConnectX-9 SuperNIC」と「Google Virgo」を組み合わせることで、単一サイトのクラスターで最大8万基、マルチサイトクラスターで最大96万基のNVIDIA Rubin GPUまでスケール可能になるとのことです。

このほか、NVIDIA BlackwellおよびNVIDIA Blackwell Ultra GPU上で動作するGoogle Distributed Cloud上のGoogle Geminiのプレビュー、NVIDIA Blackwell GPUを備えた機密VM、そしてNVIDIA NemotronのオープンモデルとNVIDIA NeMoフレームワークを用いたGemini Enterprise Agent Platform上のエージェント型AIなど、さまざまなシステムも統合できます。

NVIDIAが1200億パラメータ規模の日本語対応ハイブリッドMoEオープンウェイトAIモデル「Nemotron 3 Super」を発表 – GIGAZINE