複数のAI企業や団体が画像生成AIを開発しており、どの開発者も自身が開発した画像生成AIの性能の高さをアピールしています。「GenAI Image Showdown」は複数の画像生成AIに同じプロンプトを入力した結果をまとめたウェブサイトで、どの画像生成AIがプロンプトに忠実な画像を生成できるのかが一発で分かります。
GenAI Image Showdown
https://genai-showdown.specr.net/
6種の画像生成AIに「スパイク付きのヘルメットを着用した2人のプロイセン兵士が向かい合い、金属製のリングを互いのヘルメットのスパイクに向けて投げ合うゲームをしている」というプロンプトを入力した結果が以下。AIの種類は左上から順にBlack Forest Labsの「FLUX.1 [dev]」、Googleの「Gemini 2.0 Flash」、テンセントの「Hunyuan Image 2.0」、Googleの「Imagen 3およびImagen 4」、Midjourneyの「Midjourney V7」、OpenAIの「4o Image Generation」です。Imagen 3とImagen 4がひとまとめになっているのは、両者の結果に有意な差が見られなかったからとのこと。6種の画像生成AIのうち「FLUX.1 [dev]」「Imagen 3およびImagen 4」「4o Image Generation」の3種がプロンプト通りの画像を生成することに成功しました。
「9個のトンガリがある星のデジタルイラスト」というプロンプトだと、「FLUX.1 [dev]」「Midjourney V7」「4o Image Generation」の3種が正しい画像を生成できました。
「5色のキューブを含むレイトレーシング画像。赤色のキューブは青色キューブの上に積み重なる。青色キューブは緑色のキューブの上に積み重なる。緑色キューブは紫色のキューブの上に積み重なる。紫色キューブは黄色のキューブの上に積み重なる。つまり、上から順に赤、青、緑、紫、黄の順番である。キューブは部分的に半透明でガラス製である」というプロンプトの場合、「Midjourney V7」以外の5種で正しく生成できました。
迷路を生成しつつ、迷路の正解ルートも示すように指示すると、「4o Image Generation」のみが正しく生成することに成功。
「小さい素数から順に20個の素数で構成された20面ダイス」というプロンプトだと、すべての画像生成AIが生成に失敗しました。
合計12個のテストの結果をまとめたグラフが以下。最も正答率が高かったのは「4o Image Generation」で、その後に「Imagen 3およびImagen 4」「FLUX.1 [dev]」「Gemini 2.0 Flash」「Hunyuan Image 2.0」「Midjourney V7」が続きました。
この記事のタイトルとURLをコピーする
・関連記事
高品質かつ高速な画像生成AI「FLUX.1 Kontext」が登場したので使ってみた、テキストと画像の入力に対応しアニメ風も実写風も生成可能 – GIGAZINE
Googleが画像生成AI「Imagen 4」を発表、最大2Kの画像を生成可能でImagen 3より10倍高速なハイスピード版も登場予定 – GIGAZINE
ChatGPTに高精度な画像生成機能「4o Image Generation」が追加される、GPT-4oの知識を活用しつつ画像を生成可能で著名人を含む画像も可 – GIGAZINE
ソース元はコチラ
この記事は役に立ちましたか?
もし参考になりましたら、下記のボタンで教えてください。