「GPT-5が未解決の数学問題を解決した」とOpenAIの研究者が投稿も実際は既に解決済みの問題だったことが明らかになりGoogle DeepMindのデミス・ハサビスCEOらライバル開発者から嘲笑される – GIGAZINE


OpenAIが、「20世紀に最も多くの論文を書いた数学者」として知られるポール・エルデシュ氏が提起した未解決の数学問題「エルデシュの問題」を複数解決したと投稿。しかし、実際には既に解決済みの問題の解法を文献から探してきただけであることが明らかになり、競合のAI開発者たちから小ばかにされる事態が起きています。

Leading OpenAI researcher announced a GPT-5 math breakthrough that never happened
https://the-decoder.com/leading-openai-researcher-announced-a-gpt-5-math-breakthrough-that-never-happened/


OpenAI’s ‘embarrassing’ math | TechCrunch
https://techcrunch.com/2025/10/19/openais-embarrassing-math/

2025年10月18日、OpenAIの最高製品責任者(CPO)であるケビン・ワイル氏が、「GPT-5がこれまで未解決だったエルデシュの問題を10個も解決しました!さらに、他の11個の問題でも進展をもたらしました」と投稿。ワイル氏はGPT-5が解決した問題は数十年にわたって未解決だったとアピールしています。なお、記事作成時点でワイル氏の当該投稿は削除されています。


ワイル氏に同調するように、OpenAIの他の研究者もGPT-5が未解決の数学の問題を解決することができたとアピールしています。OpenAIのコンピューターサイエンティストであるセバスチャン・ブーベック氏は、「GPT-5 Proは文献検索において超人的です。公式データベースに未解決として記載されているエルデシュの問題を、20年前にすでに解決されていたことに気づくことで解決しました」と投稿。


このブーベック氏の投稿を受けて、ハーバード大学統計学部のマーク・セルケ准教授が、「GPT-5の数千のクエリを利用して、未解決としてリストされていた10個のエルデシュの問題の解決策を見つけました。解決したのは223、339、494、515、621、822、883(パート2/2)、903、1043、1079の10個です。さらに、他の11個の問題(32、167、188、750、788、811、827、829、1017、1011、1041)で、GPT-5は公式ウェブサイトに追加した重要な部分的な進展を見つけました。827については、エルデシュの元の論文に実際には誤りがあったため、マルティネスとロルダン・ペンサドの研究がこれを説明し、議論を修正しています。科学研究の未来は楽しくなるでしょう」と補足説明しました。


これに対してOpenAIのボリス・パワー氏は「うわっ、これまで解決できなかった問題で、ついに大きな進展が起きました!!」と反応しています。


しかし、公式データベースとされたErdős Problemsを運営する数学者のトーマス・ブルーム氏が即座にOpenAIの研究者による投稿に反論。サイト上で未解決とされている問題は、自身が個人的に解決方法を知らない問題であり、実際に未解決というわけではないと説明しました。


これに対して、OpenAIの競合であるGoogle DeepMindのデミス・ハサビスCEOは「これは恥ずかしいね」と反応しています。


ブルーム氏の投稿の後、ブーベック氏は「元の投稿を削除しました。明らかに誰かを誤解させるつもりはありませんでした。言葉遣いが明確だと思っていましたが、すみませんでした。文献には解決策しか見つかりませんでした。それだけです。そして、文献を調べるのがどれほど難しいかを知っているので、これは非常に加速していると感じます」と投稿し、GPT-5が難しい数学の問題に対する証明を独自に生成したかのように投稿したことを謝罪し、当該ポストを削除しました。


ブーベック氏による謝罪ポストに対して、MetaのチーフAIサイエンティストを務めるヤン・ルカン氏は「自らのGPTards(ChatGPTなどのAIツールを過剰に信奉する人を嘲るネットスラング)に巻き込まれた」と投稿しています。

この記事のタイトルとURLをコピーする

・関連記事
OpenAIの「実験的推論モデル」が数学オリンピックで金メダル相当のスコアを達成、GPT-5は近日中にリリース予定で「実験的推論モデル」はまだ先 – GIGAZINE

GPT-5のような大規模言語モデルがなぜ幻覚を起こしてしまうのかをOpenAIの研究チームが論文で発表 – GIGAZINE

数学性能の超高い「Gemini 2.5 Deep Think」のテストが始まる – GIGAZINE

人工知能やロボットが社会を変える将来、人間はどのように社会を捉えて生きるべきなのか? – GIGAZINE




元の記事を確認する

関連記事