「Grok 4.1」が登場、Xで無料で使えてGemini 2.5 Proを超える性能 – GIGAZINE


AI


イーロン・マスク氏がCEOを務めるAI開発企業のxAIが「Grok 4.1」を2025年11月18日(火)にリリースしました。Grok 4.1はすでにX(旧Twitter)やGrokアプリで利用可能となっています。

Grok 4.1 | xAI
https://x.ai/news/grok-4-1


Grok 4.1はGrok 4と同じ大規模強化学習インフラストラクチャーを用いて開発されたモデルで、従来のモデルの能力を維持しつつ創造的・感情的・協調的な分野において高い能力を発揮するように設計されています。XとGrokアプリでは2025年11月1日から2025年11月14日にかけてGrok 4.1が名前を伏せた状態でテストされており、64.78%の応答で従来のモデルよりも優れていると評価されました。


Grok 4.1は即座に応答する「Grok 4.1(コードネーム:tensor)」と長い思考を伴う「Grok 4.1 Thinking(コードネーム:quasarflux)」に分かれています。両モデルは匿名AI同士の性能を人間に比べさせるLMArenaにも参加しており、GoogleのGemini 2.5 Proを抑えてGrok 4.1 Thinkingが1位、Grok 4.1が2位の座を獲得しました。


AIモデルの共感力や対人スキルなどを測定できる「EQ-Bench 3」でもGrok 4.1とGrok 4.1 Thinkingがトップ2にランクインしています。


また、Grok 4.1は誤った回答を出力してしまうハルシネーションの頻度が抑えられているのも特徴です。Grok 4 Fast(灰色)とGrok 4.1(オレンジ色)の性能を比較した図が以下。ハルシネーションの頻度(Hallucination Rate)はGrok 4.1の方が低く、ハルシネーションに関するベンチマーク「FActScore」でもGrok 4.1の方が優秀なスコアを記録しています。


Grok 4.1はXとGrokアプリの無料プランを含むすべてのユーザーが利用可能です。PCのウェブアプリ版XでGrok 4.1を使うには、画面左側のGrokボタンをクリックしてから画面上部のモード選択エリアをクリックし、「Grok 4.1」をクリックすればOK。


これで、Grok 4.1が応答してくれます。


回答の末尾に表示される「もっとよくシンキングする」をクリックすると、同じ質問内容について長い思考を伴う回答を返してくれます。


「もっとよくシンキングする」をクリックしてみたところ、ウェブ上の情報を検索しつつ7秒間思考してから回答してくれました。


なお、Grok 4.1の安全性評価などをまとめたモデルカードは以下のリンク先で閲覧できます。

Grok 4.1 Model Card
(PDFファイル)https://data.x.ai/2025-11-17-grok-4-1-model-card.pdf

この記事のタイトルとURLをコピーする


ソース元はコチラ

この記事は役に立ちましたか?

もし参考になりましたら、下記のボタンで教えてください。

関連記事