Claudeの品質が低下していた問題についてAnthropicが調査結果を報告、ユーザーには利用制限をリセットへ – GIGAZINE

2026年04月24日 11時25分
AI

AIサービス「Claude」の利用者から「品質が低下した」との声が相次いでいた問題に対し、Anthropicが原因を調査して結果を報告しています。

An update on recent Claude Code quality reports \ Anthropic
https://www.anthropic.com/engineering/april-23-postmortem

Anthropicによると、2026年3月4日から2026年4月20日にかけて、3つの原因によってClaude Code、Claude Agent SDK、Claude Coworkの性能が低下していたとのこと。APIに影響は出ていなかったとされています。

◆原因その1：Claude Codeの標準推論負荷を引き下げたこと
ほとんどの場合、AIモデルの思考時間が長いほど出力が良くなりますが、返答までの時間が増加したり、使用制限に引っかかりやすくなったりするなどのデメリットもあります。そのため、Claude Codeではユーザーが「AIにどの程度思考させるか」を設定できるようになっています。

2026年2月にClaude Opus 4.6をClaude Codeにリリースする時、Anthropicは標準の推論負荷の設定を「high」にしました。しかし、high設定ではまれに思考が非常に長くなってしまう場合があり、「推論に時間がかかりすぎてUIがフリーズしたように見えてしまう」「推論に時間がかかりすぎた場合にトークン使用量がいきなり増える」というフィードバックがユーザーから寄せられていました。

社内テストでは、「medium」に引き下げても、ほとんどのタスクにおいてわずかな品質低下と引き換えに遅延が大幅に短縮できるという結果が出ていました。

そこで、Anthropicは遅延を軽減するため、2026年3月4日に標準の推論負荷をhighからmediumに変更しました。Claude Codeのダイアログでも「medium設定がオススメ」と案内を出していたとのこと。

しかし、変更後すぐにユーザーから「Claude Codeの知性が低下した」という報告が相次ぎ発生。Anthropicは「設定を変更できる」点をユーザーに知らせるため、起動時の通知や作業負荷設定のセレクターなどのデザインを変更しましたが、ほとんどのユーザーは標準設定のまま使用を続けました。

結局、Anthropicは2026年4月7日に変更を撤回し、Claude Opus 4.6の標準設定をhighの一段階上の「xhigh」に、その他のモデルの標準設定を「high」に変更し直したとのことです。

◆原因その2：古い思考を削除する変更
Claudeがタスクを実行する際に行った推論は会話履歴にキャッシュとして保存され、その後推論を続ける場合に参照できるようになっています。しかし古いキャッシュがたまりすぎるとプロンプトに収まらなくなるため、Anthropicは2026年3月26日に「セッションが1時間以上アイドルだった場合に古い思考履歴を削除する」という変更を行いました。

しかし、実装にバグがあり、「1時間以上アイドルだった場合に過去の思考履歴を削除する」という実装をするはずが、「1時間以上アイドルだったことがあるセッションの思考履歴を削除する」という実装になってしまっていました。Claudeは新たな思考に入るたびに前の思考を忘れてしまう状態になり、ユーザーから「物忘れや繰り返しがひどい」という報告が寄せられることになりました。

後続のリクエストから以前の思考が継続的に削除されることで、キャッシュミスを多発させる問題も引き起こしたとのこと。Anthropicは「『使用制限があっという間に消費されてしまう』という問題の根本的な原因だったと考えている」と述べています。

AnthropicのClaudeが一般的な使い方であっという間に使用量制限に到達して使い物にならないという報告 – GIGAZINE

思考履歴が誤って削除されてしまうバグは2026年4月10日に修正済みとのこと。

◆原因その3：冗長性を軽減するためのシステムプロンプトの変更
2026年4月16日に登場したClaude Opus 4.7は、以前のモデルに比べて非常に出力が長くなる「冗長性」を持っています。難問への対応力は高いものの、出力トークンの数も増加してしまうため、Anthropicはシステムプロンプトに文字数の制限を追記しました。

具体的には「ツール呼び出し間のテキストは25語以下にしてください。タスクでより詳細な説明が必要な場合を除き、最終回答は100語以下にしてください」などの文言を追加したとのこと。数週間にわたる社内テストでは不具合が発生しなかったことから、Anthropicは自信を持ってClaude Opus 4.7と同時に新しいシステムプロンプトをリリースしました。

しかし、今回の調査にあたり、より広範な評価セットを用いてシステムプロンプトの変更が与えた影響を調査すると、Claude Opus 4.6およびClaude Opus 4.7の両方で約3％の性能低下が確認できたとのこと。2026年4月20日にシステムプロンプトを元に戻したとAnthropicは述べています。

Anthropicは「性能低下に関する報告を非常に深刻に受け止めております。弊社は意図的にモデルを劣化させることは決してありません」と述べ、2026年4月23日に全てのユーザーの使用制限をリセットしたと発表しています。

この記事のタイトルとURLをコピーする

ソース元はコチラ

この記事は役に立ちましたか？

もし参考になりましたら、下記のボタンで教えてください。

テックニュース

テンセントが高性能推論モデル「Hy3 preview」を公開、295B-A21BなMoEモデルで高い効率性 - GIGAZINE 前の記事 OpenAIが「GPT-5.5」をリリース、Claude Opus 4.7を上回る性能 - GIGAZINE 次の記事

関連記事

Z世代の半数以上がたった1つの作品のためにストリーミングサービスを解約・更新していることが調査で判明 – GIGAZINE

無料で非常に強力なスクリーンキャプチャツール「Flameshot」

初代Macintoshに搭載された計算機のデザインはスティーブ・ジョブズが設計した – GIGAZINE

FLUXのBlack Forest Labsが高効率＆高精度で画像・動画・音声を生成するマルチモーダルAIの学習手法「Self-Flow」を発表 – GIGAZINE

睡眠時間が長すぎる人の死亡リスクが高い理由とは？

生きた植物や骨に直接電子回路を印刷できる3Dプリンティング技術が開発される