xAIは、大規模言語モデル(LLM)「Grok 4 Fast」をリリースした。フラグシップモデル「Grok 4」と同等の性能を持たせつつ、コストを大幅に軽減したという。xAIはGrok 4 Fastを「AI技術の民主化に向けた第1歩」と位置付け、すべてのユーザーに利用制限なしで無料公開している。
Grok 4 Fastはコスト効率を重視して開発された最新のLLMだ。推論能力や、Web検索を含むエージェント能力を測定するベンチマークなどにおいて「Grok 3 Mini」を大きく上回り、Grok 4に匹敵、あるいは上回る性能を発揮したという。
Grok 4 Fastでは、LLMが推論中に使用する中間段階「思考トークン」を強化学習によって削減し、より少ないステップで推論させることで、コスト効率を向上させている。これにより、Grok 4に比べて計算リソースは平均40%、計算に必要なコストは最大98%の削減に成功したとしている。
また機能上の特徴として、これまで別々に開発されていた「推論」モデルと「非推論」モデルを単一のアーキテクチャで実現しているという。既存のLLM開発においては、複雑な推論を必要とせず迅速に応答できるプロンプト向けには「非推論」モデルを、複雑な推論が必要なプロンプト向けには低速な代わりに高精度な「推論」モデルをそれぞれ用意して、使用時の状況に合わせて切り替えるという処理がなされていた。
Grok 4 Fastでは同じモデルパラメータで推論と非推論両方のモードに対応可能となった。これにより、遅延やコストを削減でき、リアルタイムアプリケーションに最適な製品となっているという。
Grok 4 Fastはスマートフォン向けのGrokアプリや公式サイトで公開されており、無料ユーザーを含むすべてのユーザーが無制限で利用可能だ。開発者向けのAPIも公開されている。
今後もマルチモーダル機能の強化やエージェント機能の追加など、新たな統合機能を順次リリースするという。