AnthropicがマルチエージェントのClaude Researchシステムの構築方法を詳細に説明、シングルエージェントシステムと比較して社内評価が大幅に向上 – GIGAZINE

AnthropicのAIモデル「Claude」には、複数のAIエージェントが自律的に連携して動作するマルチエージェントシステムが備わっています。マルチエージェントで動作するClaude Researchをどのように開発したのかについて、詳細をAnthropicが公開しています。

How we built our multi-agent research system \ Anthropic
https://www.anthropic.com/engineering/built-multi-agent-research-system

Anthropic: How we built our multi-agent research system
https://simonwillison.net/2025/Jun/14/multi-agent-research-system/

AnthropicはチャットAI「Claude」に、ユーザーの指示に従って詳細な調査と分析を行う新機能「Research」を導入したことを2025年4月に発表しました。また、ClaudeはGmailやGoogleカレンダーを含むGoogle Workspaceと統合できるようになったため、Claudeがユーザーのメールを検索したり、ドキュメントを確認したり、カレンダーに登録されている予定を確認したりすることで、よりパーソナライズされた検索が可能となっています。

Claudeに「Research」機能が追加される、ウェブ上のデータだけでなくGmailやGoogleカレンダーの内容も参照して推論可能 – GIGAZINE

通常のAIモデルは、1つのプロンプトを単独のエージェントが処理するだけで十分に有用な結果が生まれます。しかし、Claudeは複数のエージェントを組み合わせることによってプロンプトを並行して実行しており、単独のエージェントで処理するより作業が複雑になっています。

この理由についてAnthropicは、「検索の本質は圧縮、つまり膨大なデータベースから洞察を抽出することです。サブエージェントは、それぞれ並行して動作することで圧縮を促進し、質問のさまざまな側面を同時に検索し、最も重要なトークンを凝縮します」と説明しています。例えば、「特定の条件を満たすIT企業の取締役全員を特定する」という課題を処理する場合、シングルエージェントシステムは条件に合致するデータを先頭から順番に探し出していく「シーケンシャルサーチ」を用いるため、処理が低速であり回答を見つけることができませんでした。しかし、マルチエージェントシステムは課題をサブエージェントのタスクに分解することで、正しい回答を見つけることができたとAnthropicは社内調査評価を明らかにしています。

具体的には、2025年5月に発表された「Claude 4」ファミリーのClaude Opus 4をリードエージェント、Claude Sonnet 4をサブエージェントとするマルチエージェントシステムは、社内調査評価において、シングルエージェントのClaude Opus 4を90.2％も上回るパフォーマンスを示したとのこと。

Anthropicはさらに、真に効果的なシステムを構築するために必要な迅速なエンジニアリングプロセスについて詳しく説明しています。以下は、Claudeに検索クエリが入力されると、リクエストがマルチエージェントシステムに送信され、リードエージェントとサブエージェントが相互作用して処理した結果をユーザーに返している流れを示した一般的なマルチエージェントアーキテクチャの動作の仕組み。

Anthropicは一般的なマルチエージェントシステムではなく、多段階の検索を用いて関連情報を動的に発見し、新たな発見に適応し、結果を分析することで高品質な回答を生成しています。以下はAnthropicが構築するマルチエージェントシステムのワークフローの図で、ユーザーがクエリを送信するとシステムが反復的なリサーチプロセスを開始する「LeadResearcherエージェント」を作成し、特定のリサーチタスクを持つ専用のサブエージェントを作成していく様子を示しています。

初期のマルチエージェントシステムは、単純なクエリに対して50もサブエージェントを生成したり、過剰な更新でエージェント同士が混乱させあったりといったエラーを起こしたりしていました。Anthropicのシステムでは、リードエージェントがサブエージェントにクエリを説明するようにしてタスクを分解していくことで、適切なエージェントの組み合わせを実現しています。

マルチエージェントシステムが機能するのは、問題を解決するために十分なトークンをそれぞれのエージェントで分散することで、単一エージェントの制限を超えるタスクのトークン使用を効果的に可能にするためです。一方でこれらのアーキテクチャは、比較的高率化したAnthropicのシステムでも、トークンを急速に消費してしまうという欠点があります。Anthropicのデータでは、エージェントはチャットボットのやりとりと比べて約4倍のトークンを使用しますが、マルチエージェントシステムではチャットボットの約15倍のトークンを使用するそうです。そのため、経済的に実現可能なものにするには、マルチエージェントシステムにはその高い性能に見合うだけの価値があるタスクを割り当てる必要があります。

Anthropicは「複数の課題を抱えているにもかかわらず、マルチエージェントシステムはオープンエンドな研究タスクにおいて価値を発揮することが証明されています。実際に、Claudeのおかげでこれまで考えもしなかったビジネスチャンスを発見したり、複雑な医療オプションを検討できたり、厄介な技術的バグを解決したり、単独では見つけられなかった研究上の関連性を発見することで数日分の作業を節約できたりといった声が寄せられています。私たちは既に、これらのシステムが複雑な問題の解決方法を変革しているのを目の当たりにしています」とマルチエージェントシステムの重要性を語りました。

この記事のタイトルとURLをコピーする

ソース元はコチラ

この記事は役に立ちましたか？

もし参考になりましたら、下記のボタンで教えてください。

テックニュース

HPの取締役会を説得してPalmを12億ドルで買収させたのちわずか49日で事業がダメになるのを見届けたCTOの記録 - GIGAZINE 前の記事中国のAI企業はAIモデルトレーニング用データをマレーシアにHDDで運ぶことで輸出規制を回避している - GIGAZINE 次の記事

関連記事

過去最高に有望な「地球外生命の兆候」が見つかる、124光年離れた「ハイセアン」惑星で – GIGAZINE

「絶対音感」を15年かけて大人になってようやく習得できたという人の体験談

テスラは300億円分のCybertruckの在庫を抱えている – GIGAZINE

小型デジカメ「X half」は「プレビューを確認せずにフィルムが切れるまで撮影して現像を待つ」というフィルムカメラの撮影体験を味わえるエモいカメラでした – GIGAZINE

AppleがAI強化版Siriのリリース遅れを理由に株主から訴えられる – GIGAZINE

「AIが生成した楽曲が毎日2万曲アップロードされている」と音楽ストリーミングプラットフォーム・Deezerが報告 – GIGAZINE