「DeepSeek-V3.1」登場、推論モードと非推論モードを両立させてDeepSeek-R1より高速化したハイブリッドモデル – GIGAZINE

by Trong Khiem Nguyen

中国のAI企業であるDeepSeekがオープンウェイトモデル「DeepSeek-V3.1」を2025年8月21日にリリースしました。このモデルは、エージェントの時代に向けた第一歩として位置づけられており、推論モードと非推論モードを両立させて高速化を図るハイブリッドモデルとなっています。

DeepSeek-V3.1 Release | DeepSeek API Docs
https://api-docs.deepseek.com/news/news250821

Introducing DeepSeek-V3.1: our first step toward the agent era! ????
???? Hybrid inference: Think & Non-Think — one model, two modes
⚡️ Faster thinking: DeepSeek-V3.1-Think reaches answers in less time vs. DeepSeek-R1-0528
????️ Stronger agent skills: Post-training boosts tool use and…
— DeepSeek (@deepseek_ai) August 21, 2025

DeepSeek-V3.1の主な特徴は、思考を行う「Think」モードと、行わない「Non-Think」モードの2つを1つのモデル内に持つハイブリッド推論スタイルです。Thinkモードは思考速度が向上しており、旧モデルのDeepSeek-R1-0528よりも短時間で回答を生成します。また、事前トレーニングにより、ツールの使用や複数ステップを要するエージェントタスクのスキルが強化されているとのこと。この新機能は、公式サイトのチャットで「DeepThink」ボタンを切り替えることで試用できます。

DeepSeek – Into the Unknown
https://chat.deepseek.com/

APIも更新され、「deepseek-reasoner」がThinkモード、「deepseek-chat」がNon-Thinkモードとして提供されます。両モデルともに128Kのコンテキスト長をサポートしており、さらにAnthropic APIフォーマットや、ベータAPIでの厳密な関数呼び出し(Strict Function Calling)にも対応しました。APIリソースも増強され、よりスムーズな利用体験が提供されます。

ツールとエージェントの機能もアップグレードされ、SWE-benchやTerminal-Benchといったベンチマークでより良い結果を記録しています。複雑な検索タスクにおける複数ステップの推論能力が強化され、思考の効率も大幅に向上しました。

ベンチマークスコアを見ると、SWE-bench Verifiedで66.0を記録し、DeepSeek-V3-0324の45.4やDeepSeek-R1-0528の44.6を上回りました。SWE-bench Multilingualでは54.5、Terminal-Benchでは31.3を達成しています。

その他のベンチマークにおいても、BrowseCompで30.0、BrowseComp_zhで49.2、Humanity’s Last Examで29.8、xbench-DeepSearchで71.2など、多くの項目でDeepSeek-R1-0528のスコアを上回る結果を示しました。

思考効率の向上は出力トークン数にも反映されており、DeepSeek-V3.1のThinkモードはDeepSeek-R1-0528と比較して、AIME 2025では22,615から15,889へ、GPQA Diamondでは7,678から4,122へ、LiveCodeBenchでは19,352から13,977へと、それぞれ出力トークン数を削減しています。

DeepSeek-V3.1のモデルデータおよびトークナイザー、チャットテンプレートはHugging Faceで公開されています。また、モデルの基盤となるDeepSeek-V3.1-Baseも同時に公開されています。このDeepSeek-V3.1-BaseはV3をベースに長文コンテキスト拡張のため8400億トークンの継続的な事前学習を行ったものだそうです。

deepseek-ai/DeepSeek-V3.1-Base · Hugging Face
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

deepseek-ai/DeepSeek-V3.1 · Hugging Face
https://huggingface.co/deepseek-ai/DeepSeek-V3.1

DeepSeek-V3.1 APIの料金は、入力が100万トークンあたり0.07ドル(約11円)～0.56ドル(約80円)、出力が100万トークンあたり1.68ドル(約250円)に設定されています。

この記事のタイトルとURLをコピーする

ソース元はコチラ

この記事は役に立ちましたか？

もし参考になりましたら、下記のボタンで教えてください。

テックニュース

インドでリアルマネーゲームを全面禁止する法案が上院を通過、リアルマネーゲームを展開する企業は早速事業の撤退を開始前の記事「AIに核兵器を作らせない仕組み」をAnthropicが開発 - GIGAZINE 次の記事

関連記事

「地球低軌道に残された最も懸念されるスペースデブリ50個」最新版に日本から1個がランクイン、大半はロシア製 – GIGAZINE

もし人間の脳がもっと大きかったら？ – GIGAZINE

2025年3月10日のヘッドラインニュース – GIGAZINE

アプリ開発やゲーム開発などのITスキルをAIに相談しながら順序立てて学べる「Roadmap AI Chat」 – GIGAZINE

2025年ノーベル平和賞を受賞したマリア・コリナ・マチャド氏は何をした人なのか？ – GIGAZINE

240×135カラーTFTディスプレイ・10時間駆動のバッテリー・Wi-Fiなどを3Dプリントケースに収めた極小ゲーム開発機「DeskHog」 – GIGAZINE