NVIDIAが、次世代のエージェント型AIおよび物理AIを推進するAIファクトリー向けにGoogle Cloud AI Hypercomputerを拡張することを発表しました。最大で96万基のRubin GPUまでスケール可能なNVIDIA Vera Rubin搭載の「A5X」インスタンスを企業が利用できるようになります。
NVIDIA and Google Cloud Collaborate to Advance Agentic and Physical AI | NVIDIA Blog
https://blogs.nvidia.com/blog/google-cloud-agentic-physical-ai-factories/
.@GoogleCloud and NVIDIA are expanding their partnership across agentic and physical AI.
At #GoogleCloudNext, the companies made several announcements, including:
✅ NVIDIA Vera Rubin-powered A5X instances, scaling up to nearly 1M Rubin GPUs
✅ Gemini on Google Distributed… pic.twitter.com/5RxjUtfRJl— NVIDIA (@nvidia) April 22, 2026
新たに発表された「A5X」はNVIDIA Vera Rubin NVL72ラックスケールシステムを採用したベアメタルインスタンスです。ベアメタルインスタンスとは、仮想サーバーではなく物理サーバー単体を一社が独占利用できるシステムを指します。
A5Xは前世代と比べてトークンあたりの推論コストが最大10分の1に削減され、メガワットあたりのトークンスループットが最大10倍に向上しているとのこと。ネットワーキングシステム「NVIDIA ConnectX-9 SuperNIC」と「Google Virgo」を組み合わせることで、単一サイトのクラスターで最大8万基、マルチサイトクラスターで最大96万基のNVIDIA Rubin GPUまでスケール可能になるとのことです。
このほか、NVIDIA BlackwellおよびNVIDIA Blackwell Ultra GPU上で動作するGoogle Distributed Cloud上のGoogle Geminiのプレビュー、NVIDIA Blackwell GPUを備えた機密VM、そしてNVIDIA NemotronのオープンモデルとNVIDIA NeMoフレームワークを用いたGemini Enterprise Agent Platform上のエージェント型AIなど、さまざまなシステムも統合できます。
NVIDIAが1200億パラメータ規模の日本語対応ハイブリッドMoEオープンウェイトAIモデル「Nemotron 3 Super」を発表 – GIGAZINE
これらのサービスを利用することで、Mixture-of-Expertsによる推論、マルチモーダル推論、データ処理、フィジカルAIやロボティクスの複雑なシミュレーションに至るまで、あらゆるワークロードの最適化を実現できるとNVIDIAはアピールしました。
GoogleとNVIDIAとの提携は10年目の節目を迎えるとのことです。
この記事のタイトルとURLをコピーする
NVIDIAのAI特化CPU「Vera CPU」は一体どれだけ高性能なのか? – GIGAZINE
NVIDIAが量子コンピューターを開発するためのAI「NVIDIA Ising」を発表 – GIGAZINE
ゲームのロード時間を短縮するための「自動シェーダーコンパイル」機能がNVIDIAアプリのベータ版に登場 – GIGAZINE
この記事は役に立ちましたか?
もし参考になりましたら、下記のボタンで教えてください。

