NVIDIAが日本語特化の小型AIモデル「Nemotron-Nano-9B-v2-Japanese」を公開、10B以下で最高性能を達成し商用利用可能 – GIGAZINE


AI


NVIDIAが日本語に特化した小規模言語モデル(SLM)として「Nemotron-Nano-9B-v2-Japanese」を公開しました。Nemotron-Nano-9B-v2-Japaneseはパラメーター数100億以下の日本語モデルとして最高性能を達成しており、商用利用可能なオープンモデルとして公開されています。

NVIDIA Nemotron 2 Nano 9B Japanese: 日本のソブリンAIを支える最先端小規模言語モデル
https://huggingface.co/blog/nvidia/nemotron-nano-9b-v2-japanese-ja

記事作成時点ではクラウド上でモデルを実行するAIサービスが主流ですが、機密データを扱う企業では社内サーバーでモデルを実行する必要があります。このため社内サーバーでも十分に動作する小型かつ高性能なモデルが求められていますが、日本語処理性能の高い小型モデルは選択肢が少ない状況が続いています。

Nemotron-Nano-9B-v2-JapaneseはNemotron-Nano-9B-v2をベースに日本語データセットのNemotron-Personas-Japanなどを用いてカスタマイズしたモデルで、高度な日本語処理能力を備えたSLMとして位置付けられています。


AIモデルの日本語性能測定結果を集積しているNejumi Leaderboard(ねじゅみリーダーボード)で100億パラメータ以下のモデルに絞ったランキングが以下。Nemotron-Nano-9B-v2-JapaneseはQwen3-8BやGemma-3-12b-itといったモデルを抑えてトップスコアを記録しています。


「Qwen3-8B」「Nemotron-Nano-9B-v2」「Nemotron-Nano-9B-v2-Japanese」のカテゴリごとの性能をまとめたグラフが以下。Nemotron-Nano-9B-v2-Japaneseは知識テストやコーディングテストでベースモデルや競合モデルを上回っています。


Nemotron-Nano-9B-v2-Japaneseは高速な処理が可能なことも特徴で、NVIDIAが実行したテストではQwen3-8Bと比べて最大6倍の速度を記録しています。


Nemotron-Nano-9B-v2-Japaneseのモデルデータは以下のリンク先で公開されています。ライセンスは商用利用可能な「NVIDIA Nemotron Open Model License」です。

nvidia/NVIDIA-Nemotron-Nano-9B-v2-Japanese · Hugging Face
https://huggingface.co/nvidia/NVIDIA-Nemotron-Nano-9B-v2-Japanese


また、日本語データセットのNemotron-Personas-Japanも以下のリンク先で公開されています。ライセンスは「Creative Commons Attribution 4.0 International」です。

nvidia/Nemotron-Personas-Japan · Datasets at Hugging Face
https://huggingface.co/datasets/nvidia/Nemotron-Personas-Japan

この記事のタイトルとURLをコピーする


ソース元はコチラ

この記事は役に立ちましたか?

もし参考になりましたら、下記のボタンで教えてください。

関連記事