NVIDIAとGoogle Cloudが提携し96万基のVera Rubin搭載ベアメタルサーバーを提供へ – GIGAZINE


NVIDIAが、次世代のエージェント型AIおよび物理AIを推進するAIファクトリー向けにGoogle Cloud AI Hypercomputerを拡張することを発表しました。最大で96万基のRubin GPUまでスケール可能なNVIDIA Vera Rubin搭載の「A5X」インスタンスを企業が利用できるようになります。

NVIDIA and Google Cloud Collaborate to Advance Agentic and Physical AI | NVIDIA Blog
https://blogs.nvidia.com/blog/google-cloud-agentic-physical-ai-factories/


新たに発表された「A5X」はNVIDIA Vera Rubin NVL72ラックスケールシステムを採用したベアメタルインスタンスです。ベアメタルインスタンスとは、仮想サーバーではなく物理サーバー単体を一社が独占利用できるシステムを指します。

A5Xは前世代と比べてトークンあたりの推論コストが最大10分の1に削減され、メガワットあたりのトークンスループットが最大10倍に向上しているとのこと。ネットワーキングシステム「NVIDIA ConnectX-9 SuperNIC」と「Google Virgo」を組み合わせることで、単一サイトのクラスターで最大8万基、マルチサイトクラスターで最大96万基のNVIDIA Rubin GPUまでスケール可能になるとのことです。

このほか、NVIDIA BlackwellおよびNVIDIA Blackwell Ultra GPU上で動作するGoogle Distributed Cloud上のGoogle Geminiのプレビュー、NVIDIA Blackwell GPUを備えた機密VM、そしてNVIDIA NemotronのオープンモデルとNVIDIA NeMoフレームワークを用いたGemini Enterprise Agent Platform上のエージェント型AIなど、さまざまなシステムも統合できます。

NVIDIAが1200億パラメータ規模の日本語対応ハイブリッドMoEオープンウェイトAIモデル「Nemotron 3 Super」を発表 – GIGAZINE


これらのサービスを利用することで、Mixture-of-Expertsによる推論、マルチモーダル推論、データ処理、フィジカルAIやロボティクスの複雑なシミュレーションに至るまで、あらゆるワークロードの最適化を実現できるとNVIDIAはアピールしました。

GoogleとNVIDIAとの提携は10年目の節目を迎えるとのことです。

この記事のタイトルとURLをコピーする

・関連記事
NVIDIAがAI特化GPU「Rubin」とAI特化CPU「Vera」の詳細を発表、AIラック「Vera Rubin NVL72」の処理性能はFP64精度で2400TFLOPS&Groqの高速推論チップも統合 – GIGAZINE

NVIDIAのAI特化CPU「Vera CPU」は一体どれだけ高性能なのか? – GIGAZINE

NVIDIAが量子コンピューターを開発するためのAI「NVIDIA Ising」を発表 – GIGAZINE

ゲームのロード時間を短縮するための「自動シェーダーコンパイル」機能がNVIDIAアプリのベータ版に登場 – GIGAZINE




ソース元はコチラ

この記事は役に立ちましたか?

もし参考になりましたら、下記のボタンで教えてください。

関連記事