LLMを無料で使い放題な時代が来た。AIを「民主化」する速くて安い最新型「Grok 4 Fast」 – PC Watch

 xAIは、大規模言語モデル(LLM)「Grok 4 Fast」をリリースした。フラグシップモデル「Grok 4」と同等の性能を持たせつつ、コストを大幅に軽減したという。xAIはGrok 4 Fastを「AI技術の民主化に向けた第1歩」と位置付け、すべてのユーザーに利用制限なしで無料公開している。

 Grok 4 Fastはコスト効率を重視して開発された最新のLLMだ。推論能力や、Web検索を含むエージェント能力を測定するベンチマークなどにおいて「Grok 3 Mini」を大きく上回り、Grok 4に匹敵、あるいは上回る性能を発揮したという。

 Grok 4 Fastでは、LLMが推論中に使用する中間段階「思考トークン」を強化学習によって削減し、より少ないステップで推論させることで、コスト効率を向上させている。これにより、Grok 4に比べて計算リソースは平均40%、計算に必要なコストは最大98%の削減に成功したとしている。

推論能力ベンチマーク結果

「知能密度」(思考トークン数と推論精度の関係)

コストと推論能力の関係

エージェント能力ベンチマーク結果

 また機能上の特徴として、これまで別々に開発されていた「推論」モデルと「非推論」モデルを単一のアーキテクチャで実現しているという。既存のLLM開発においては、複雑な推論を必要とせず迅速に応答できるプロンプト向けには「非推論」モデルを、複雑な推論が必要なプロンプト向けには低速な代わりに高精度な「推論」モデルをそれぞれ用意して、使用時の状況に合わせて切り替えるという処理がなされていた。

 Grok 4 Fastでは同じモデルパラメータで推論と非推論両方のモードに対応可能となった。これにより、遅延やコストを削減でき、リアルタイムアプリケーションに最適な製品となっているという。

 Grok 4 Fastはスマートフォン向けのGrokアプリや公式サイトで公開されており、無料ユーザーを含むすべてのユーザーが無制限で利用可能だ。開発者向けのAPIも公開されている。

公式サイトでの使用シーン。アカウント登録なしでも利用可能

APIの利用価格

 今後もマルチモーダル機能の強化やエージェント機能の追加など、新たな統合機能を順次リリースするという。




元の記事を確認する

関連記事