GPT-5よりコーディング能力の高いAIモデル「Claude Sonnet 4.5」登場 – GIGAZINE

AI開発企業のAnthropicがAIモデル「Claude Sonnet 4.5」を2025年9月30日に発表しました。Claude Sonnet 4.5はGPT-5やGemini 2.5 Proと比べてコーディング性能が高いことが確かめられており、Anthropicは「世界で最も優れたコーディングモデル」とアピールしています。

Introducing Claude Sonnet 4.5 \ Anthropic
https://www.anthropic.com/news/claude-sonnet-4-5

Enabling Claude Code to work more autonomously \ Anthropic
https://www.anthropic.com/news/enabling-claude-code-to-work-more-autonomously

「Claude Sonnet 4.5」「Claude Opus 4.1」「Claude Sonnet 4」「GPT-5」「Gemini 2.5 Pro」の各種ベンチマーク結果をまとめた表が以下。Claude Sonnet 4.5はほとんどのテストで最も高いスコアを記録しています。

OpenAIが開発したコーディング能力ベンチマークテスト「SWE-bench Verified」の結果は以下の通り。Claude Sonnet 4.5はGPT-5とGemini 2.5 Proを上回っているだけでなく、コーディング特化モデル「GPT-5-Codex」よりも高い性能を示しています。加えて、複雑なタスクにおいて30時間以上動作し続けた実績もあるとのこと。

また、AIによるPC操作能力を測定するベンチマークテスト「OSWorld」では61.4％というスコアでトップの座を獲得。以下のデモ動画ではClaude Sonnet 4.5を搭載した「Claude for Chrome」でChromeを操作する様子を確認できます。

Claude for Chrome brings AI where you’re already working (Instrumental) – YouTube

Claude Sonnet 4.5は「欺瞞」「追従」「権力欲」「妄想の助長」「有害なシステムプロンプトへの従順」といった不正行動を行うリスクが低くなっていることも特徴です。以下のグラフは各種AIの「不正行動を行うリスク」を示したもので、Claude Sonnet 4.5が最もリスクを低く抑えられていることが分かります。

Claude Sonnet 4.5のAPI利用料金は20万トークン以下の入力の場合100万トークン当たり3ドル(約446円)、20万トークンを超える入力の場合は100万トークン当たり6ドル(約892円)です。また、20万トークン以下の出力は100万トークン当たり15ドル(約2230円)で、20万トークンを超える出力は100万トークン当たり22.5ドル(約3345円)です。