OpenAIは日本時間の2026年4月22日(水)、ChatGPTの画像生成機能「ChatGPT Images 2.0」を正式リリースしました。ソフトウェアエンジニアのサイモン・ウィリソン氏がChatGPT Images 2.0やその他の画像生成AIを使って、世界中で大人気の絵本シリーズ『ウォーリーをさがせ!』っぽいイラストを再現した結果を報告しています。
Where’s the raccoon with the ham radio? (ChatGPT Images 2.0)
https://simonwillison.net/2026/Apr/21/gpt-image-2/
『ウォーリーをさがせ!』は大勢の人が細かく描かれたイラストの中から、赤と白のしま模様の服がトレードマークの「ウォーリー」を探し出す絵本です。
今回ウィリソン氏は、「Do a where’s Waldo style image but it’s where is the raccoon holding a ham radio(『ウォーリーをさがせ!』風の画像を作ってくれ。ただし、今回はアマチュア無線機を持ったアライグマを探すことにして)」というプロンプトを用いて、さまざまな画像生成AIに画像を生成させました。
まずは基準として、OpenAIの「gpt-image-1」で生成した画像が以下。パッと見たところ『ウォーリーをさがせ!』がよく再現されているように思われますが、顔などの細かい部分はつぶれていたり、明らかに脚や腕が変な部分があったりします。
ウィリソン氏は上の画像をしっかり調べても、「アマチュア無線機を持ったアライグマ」を見つけることができませんでした。そこで、高解像度画像に対応したClaude Opus 4.7に「アマチュア無線機を持ったアライグマ」を探すように指示してみたものの、AIにも見つけることはできなかったとのこと。
Claude Opus 4.7は、「写真には少なくとも1匹のアライグマが写っていますが、とてもうまく隠れています。拡大した部分を注意深く見ましたが、正直なところ、アマチュア無線機を持ったアライグマをはっきりと見つけることはできませんでした」と回答しています。
続いて、GoogleのGeminiを経由して画像生成AIの「Nano Banana 2」で生成した画像が以下。
Nano Banana 2が生成した画像の中央には、以下の赤枠で示した「アマチュア無線クラブ」のブースにアライグマが描かれていました。確かに「アマチュア無線機を持ったアライグマ」はいるものの、『ウォーリーをさがせ!』のように群衆の中に隠れているわけではありません。
同じくGoogleの「Nano Banana Pro」でも画像を生成してみたところ、画像のど真ん中にひときわ大きな「アマチュア無線機を持ったアライグマ」が描かれました。確かにウォーリーっぽい赤と白のしま模様の服を着ていますが、周囲の人々よりも明らかに大きく、探すどころではなく存在がアピールされています。
最後に、新しくリリースされた「ChatGPT Images 2.0」を使い、画像サイズを3840×2160ピクセルに指定して生成させた画像が以下。
探してみたところ、左下に「アマチュア無線機を持ったアライグマ」がしっかり描かれていました。周囲から目立ちすぎるということもなく、他の画像生成AIと比較するとかなりクオリティが高いものとなっています。なお、今回ChatGPT Images 2.0で画像を生成するために使用した出力トークンは1万3342トークンで、1枚あたりのコストは約40セント(約64円)とのこと。
ウィリソン氏は、「この新しいChatGPTの画像生成モデルは、少なくとも現時点ではGeminiから王座を奪ったと思います。『ウォーリーをさがせ!』のような画像は、これらのモデルをテストする上でいらだたしくやや愚かな方法ですが、テキストと詳細を組み合わせた複雑なイラストを生成する能力がどれほど向上しているのかを示すのに役立ちます」と述べました。
この記事のタイトルとURLをコピーする
ソース元はコチラ
この記事は役に立ちましたか?
もし参考になりましたら、下記のボタンで教えてください。







