世界最長のコンテキストウィンドウ100万トークン入力・8万トークン出力対応にもかかわらずたった7800万円でトレーニングされたAIモデル「MiniMax-M1」がオープンソースで公開され誰でもダウンロード可能に – GIGAZINE


中国の上海に拠点を置くAI企業のMiniMaxが、最新の大規模言語モデル(LLM)である「MiniMax-M1」をオープンソース化すると発表しました。MiniMax-M1は世界最長のコンテキストウィンドウである「100万トークン入力」「8万トークン出力」に対応しており、オープンソースモデルの中で最先端のエージェントを利用していることがアピールされています。


GitHub – MiniMax-AI/MiniMax-M1: MiniMax-M1, the world’s first open-weight, large-scale hybrid-attention reasoning model.
https://github.com/MiniMax-AI/MiniMax-M1

MiniMax-M1 – a MiniMaxAI Collection
https://huggingface.co/collections/MiniMaxAI/minimax-m1-68502ad9634ec0eeac8cf094

MiniMaxはMiniMax-M1について、「世界初のオープンウェイトかつ大規模ハイブリッドアテンション推論モデル」とアピールしています。MiniMax-M1はハイブリッドMixture-of-Experts(MoE)アーキテクチャとLightning Attentionメカニズムを組み合わせたものです。

MiniMax-Text-01をベースに開発されたMiniMax-M1は、合計4560億のパラメーターが含まれており、トークンごとに459億のパラメーターがアクティブになるとのこと。MiniMax-Text-01と同様に、MiniMax-M1は100万トークンのコンテキストウィンドウをネイティブでサポートしています。これはDeepSeek R1の8倍に相当するコンテキストウィンドウです。

MiniMax-M1はLightning Attentionメカニズムを採用しているため、テスト時の計算を効率的にスケーリングすることが可能です。例えば、MiniMax-M1は10万トークンのコンテキストウィンドウで、DeepSeek R1と比較して25%のFLOPしか消費しません。この特性により、MiniMax-M1は長いコンテキストウィンドウや広範な思考を必要とするような複雑なタスクに特に適した設計になっているそうです。

以下のグラフは競技レベルの数学、コーディング、ソフトウェアエンジニアリング、エージェントツールの使用、長文理解タスクにおけるパフォーマンスを主要な商用AIモデルと比較したもの。赤色がMiniMax-M1で、どのタスクにおいても競合AIモデルに匹敵するパフォーマンスを発揮できていることがよくわかるはずです。


MiniMax-M1の使用例は以下の通り。

プロンプトをドロップするだけで、キャンバスベースのアニメーションパーティクル背景を持つHTMLページを即座に生成。


「MiniMax-M1にタイピング速度テストの作成を依頼したところ、WPMをリアルタイムで追跡するクリーンで機能的なウェブアプリが生成されました。
プラグインもセットアップも不要。実用的ですぐに本番環境に投入できる AI です。 👇」


「キャンバスベースのアニメーション粒子背景を持つHTMLページを作成してください。粒子は滑らかに動き、近づくと繋がるようにします。キャンバスの中央に見出しテキストを追加してください」というプロンプトで生成されたHTMLページが以下。HTMLのキャンバス要素とJavaScriptで生成されています。


「迷路生成器と経路探索可視化ツールを作成してください。ランダムに迷路を生成し、アルゴリズムがそれを段階的に解く様子を視覚化してください。キャンバスとアニメーションを使用し、視覚的に魅力的なものにしてください」と入力して生成された迷路生成器および経路探索可視化ツール。


他にも、AI講師のMin ChoiさんがMiniMax-M1の使用事例を公開しています。以下は予告編を再生できるNetflixのクローンアプリ。


AIストラテジストのDavid Hendrickson氏は、「新しくリリースされたMiiniMax-M1 80BとClaude Opus 4を比較しました。MiiniMax-M1はいくつかのベンチマーク、特に長いコンテキスト駆動のベンチマークでClaude Opus 4のパフォーマンスを上回りました」と報告しています。


MiniMaxはインターネット大手のテンセントとアリババが支援するAIスタートアップ企業群に属しています。これらの企業は過去1年間で数十億ドル(数千億円)の資金を調達しましたが、DeepSeekの成功により、ほとんどの企業は基礎研究を縮小し、応用研究に注力せざるを得なくなりました。

しかし、MiiniMax-M1の発表は、MiniMaxが別の道を見つけたことを示唆しているとAI関連メディアのimplicator.aiは指摘しています。MiiniMaxはモデル開発から撤退するのではなく、効率性とオープンアクセスに注力することで、独自の路線を見出した可能性があるというわけです。

なお、MiiniMax-M1のトレーニング予算はわずか53万4700ドル(約7800万円)であり、最先端のAIモデルがもはや膨大な企業リソースを必要としないことを示唆しています。

この記事のタイトルとURLをコピーする




ソース元はコチラ

この記事は役に立ちましたか?

もし参考になりましたら、下記のボタンで教えてください。

関連記事