Googleが単一のGPUで実行できる中では過去最高の大規模言語モデル「Gemma 3」を発表 – GIGAZINE

Googleが2025年3月12日に、オープンソースで商用利用も認められている大規模言語モデル「Gemma 3」を発表しました。Googleによると、Gemma 3は単一のGPUまたはTPUで実行できる大規模言語モデルとしては世界最高のモデルとのことです。

Gemma 3: Google’s new open model based on Gemini 2.0
https://blog.google/technology/developers/gemma-3/

Gemma 3 モデルの概要 | Google AI for Developers
https://ai.google.dev/gemma/docs/core

Gemma3Report.pdf
(PDFファイル)https://storage.googleapis.com/deepmind-media/gemma/Gemma3Report.pdf

GoogleはGeminiの研究資源を活用したオープンソースの大規模言語モデルとして「Gemma」を公開しており、2024年5月にはパラメータ数700億のLlama 3 70Bに匹敵する性能を発揮できる大規模言語モデル「Gemma 2」をリリースしていました。

Googleがオープンソースのビジュアル言語モデル「PaliGemma」を公開＆Llama 3と同等性能の大規模言語モデル「Gemma 2」を発表 – GIGAZINE

そしてGoogleは新たに、Gemma 2の強化版であるGemma 3を発表しました。Googleの大規模言語モデル「Gemini 2.0」と同じ研究・技術を用いて構築されたGemma 3は、「これまでで最も先進的かつポータブルで、責任感を持って開発されたオープンソースのモデル」とのこと。

Gemma 3にはパラメータ数別に10億・40億・120億・270億の4つのモデルがあり、ユーザーは特定のハードウェアとパフォーマンスのニーズに合わせて最適なモデルを選択することが可能です。また、Googleは「Gemma 3は、スマートフォンやラップトップ、ワークステーションなど、あらゆるデバイス上で高速に動作するよう設計されており、開発者は好きな場所でAIアプリケーションを作成できます」と述べています。

Gemma 3は単一のGPUまたはTPUで実行できることが特徴の1つで、大規模言語モデルの相対的な能力を測定するために使用する「Chatbot Arena」において、単一のNVIDIA H100を用いるGemma 3 27Bが複数のH100を使用するDeepSeek v3やLlama 3 405Bを超える性能を発揮できることが報告されています。

また、Gemma 3は140以上の言語を事前学習済みで、ユーザーのさまざまな言語に合わせたアプリケーションを構築可能。さらに、12万8000トークンのコンテキストウィンドウを持ち、複雑なタスクの処理を行うこともできます。

Googleは「Gemma 3の開発の際には、広範なデータガバナンスや、当社の安全ポリシーとの整合性のために微調整を行いました。より強力なモデルを開発するにあたって、安全性に対するリスクに比例したアプローチを産業界が共同で開発することが重要になります。私たちは、Gemma 3のようなオープンソースモデルでの安全対策を時間をかけて学び、改善し続けていきます」と語りました。

なお、Gemma 3はKaggleならびにHugging Faceで入手可能です。

Gemma 3 Release – a google Collection
https://huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d