GPT-5.5が「ネットワーク完全乗っ取り攻撃」を自律的に成功、Claude Mythos Previewに続いて2例目 – GIGAZINE

2026年05月01日 12時05分
AI

イギリスの政府系機関・AI Security Institute(AISI)によるサイバー攻撃性能の検証で、GPT-5.5が「ネットワーク完全乗っ取り攻撃」を成功させられる性能を持っていることが明らかになりました。

Our evaluation of OpenAI’s GPT-5.5 cyber capabilities | AISI Work
https://www.aisi.gov.uk/blog/our-evaluation-of-openais-gpt-5-5-cyber-capabilities

AISIは複数のテストを継続的に実施してAIのサイバー攻撃性能の変遷を記録しています。2026年4月にリリースされた「Claude Mythos Preview」は高い精度を見せ、企業のネットワークに対する乗っ取り攻撃をシミュレートした「The Last Ones(TLO)」というテストも完遂しました。TLOの攻撃テストは32段階に分かれており、人間なら20時間を要し、これまでのAIモデルでは完遂例がありませんでした。

「Claude Mythos Preview」はネットワーク完全乗っ取り攻撃を自律的に実行できてしまうことがイギリス政府機関のテストで判明 – GIGAZINE

今回AISIは「Mythos PreviewがTLOに成功したのは、特定モデルのみ限定のブレイクスルーなのか、AI全般の流れなのか」の確認も含めて、OpenAIがリリースしたGPT-5.5の評価を行いました。

OpenAIが「GPT-5.5」をリリース、Claude Opus 4.7を上回る性能 – GIGAZINE

以下のグラフは縦軸が完了したステップ数、横軸が累積トークン数で、GPT-5.5はMythos Previewと同じく平均すると32あるステップのうち22まで到達。点線で示されているのは最良の結果で、GPT-5.5はMythos Previewに続いてTLOに成功しました。Mythos Previewは10回の試行のうち3回、GPT-5.5は10回の試行のうち2回が成功でした。

GPT-5.5はTLO以外のテストでも高い成績を収めています。ターゲットシステムの隠された情報を取得するキャプチャー・ザ・フラッグ(CTF)形式のサイバー攻撃性能テストのうち、上から2番目の「Practitioner(実務者)」と最高難度の「Expert(熟練者)」の成功率をモデルのリリース時期とともにグラフ化したものが以下。上の少し色が薄い点線と丸印が実務者レベル、下の色が濃い点線と丸印が熟練者レベルの結果で、青く囲ったMythos Previewより、赤く囲ったGPT-5.5の方が少し成功率が上がっています。GPT-5.5の熟練者レベルの平均成功率は71％だったとのこと。

「カスタム仮想マシンをリバースエンジニアリングする」という最も難度の高い課題は、人間の専門家の場合12時間ほどかかるのですが、GPT-5.5は1.73ドル(約272円)かけて11分未満で解決しました。

今回の結果についてAISIは、あくまで制御された環境下での能力評価であり、テスト環境にアクティブな防御者や防御ツールが不足しているため、十分に防御された標的に対してGPT-5.5が攻撃を成功させられるかどうかは判断できないと述べました。

These are capability evaluations in controlled settings. Our current test environments lack active defenders and defensive tooling. We cannot say from these results whether GPT-5.5 would succeed against well-defended targets.
— AI Security Institute (@AISecurityInst) April 30, 2026

この記事のタイトルとURLをコピーする

ソース元はコチラ

この記事は役に立ちましたか？

もし参考になりましたら、下記のボタンで教えてください。

テックニュース

ChatGPTやCodexが「ゴブリン」を連呼するようになった原因をOpenAIが解説、オタクっぽいしゃべり方の学習方法に問題があった - GIGAZINE 前の記事 Google検索結果の「トップニュース」欄で特定のサイトを優先表示する機能が全世界で利用可能に - GIGAZINE 次の記事

関連記事

2026年4月10日のヘッドラインニュース – GIGAZINE

あらゆる画像生成AIの性能を測定できるベンチマーク「ImagenWorld」登場、画像生成や画像編集の精度を評価し苦手分野を特定可能 – GIGAZINE

WordPressが「My WordPress」リリース、ウェブブラウザだけで完全に動作しプラグインが使えるWordPressを構築可能でバックアップしてどこにでも復元可能でRSSリーダー化も可能 – GIGAZINE

あの「2B」がデスクトップ上に現れる「Desktop Mate NieR:Automata ヨルハ二号B型 DLC」が登場、もちろん自爆衣装パージもあり

文字列変換アルゴリズム「Burrows-Wheeler変換」についてGoogleがムービーで解説、考案者本人も出演して説明する貴重な映像 – GIGAZINE

画像や動画から主要な3D情報を爆速で自動抽出できる「VGGT」が登場、カメラパラメータ・ポイントマップ・深度マップ・3Dポイントトラックなど