Googleが画像生成AIのGemini 3 Pro Image(Nano Banana Pro)を2025年11月20日に発表しました。Gemini 3 Proをベースに構築されたNano Banana Proは、Gemini 2.5 Flash Image(Nano Banana)よりも優れた情報視覚化を実現しているとのことです。
Nano Banana Pro: Gemini 3 Pro Image model from Google DeepMind
https://blog.google/technology/ai/nano-banana-pro/
Nano Banana Pro: Gemini 3 Pro Image model from Google DeepMind
https://blog.google/technology/ai/nano-banana-pro/
Googleは「Nano Banana Pro は、プロトタイプから、データをインフォグラフィックとして表現したり、手書きのメモを図表に変換したりするなど、あらゆるアイデアを視覚化し、あらゆるものを設計するのに役立ちます」と述べており、Gemini 3の高度な推論機能を搭載することによって、ただ画像を生成するだけでなく、与えられた情報からインフォグラフィックや図表を作成することも可能になっているとしています。
Nano Banana ProはGeminiアプリで「思考」モデルを選択し、「画像を作成」を選択することで利用可能。有料サブスクリプションプランであるGoogle AIのユーザーだけでなく、無料ユーザーも使うことができますが、画像を生成できる量には制限があるとのこと。今回は1枚の写真を読み込ませた上で、夜の写真に加工するよう指示してみました。
従来のNano Bananaが出力した結果が以下。
これに対して、Nano Banana Proの出力結果はこんな感じ。Nano Bananaが出力したものよりも夜の雰囲気がしっかりと出ているのがわかります。
以下は、Nano Bananaに「カレーの作り方を1枚の図表で解説してください」と指示して出力された画像。絵だけ見るとうまく説明できているように見えますが、中に書かれている日本語はめちゃくちゃで、順番の数字も正しくありません。
そして、Nano Banana Proに同じ指示を与えて出力してもらった画像が以下。なぜか2から4に、3から5に矢印が飛んでいるというミスはありますが、日本語や描かれているイラストは正確です。
Nano Banana Proに「自転車に乗ったペリカン」を生成させるとこんな感じ。
Googleが提示しているNano Banana Proによる作例が以下。映画の1シーンを読み込ませた上でイメージボードの作成を指示したところ、撮影に必要な情報をまとめたイメージボードを手書き風のイラストで出力しています。
観葉植物の写真を読み込ませてインフォグラフィックの作成を指示すると、その植物の名前や原産地、植生などをイラストとともに1枚にまとめたインフォグラフィックが出力されました。
複数の画像素材を一貫したデザインのもと、1枚の画像に仕立てることも可能。Nano Banana Proでは最大14枚の画像を使い、最大5人の人物の一貫性と類似性を維持しながら画像を生成可能です。
画像生成AIで文字入りの画像を生成しようとすると、文字が絵柄と認識されてしまうために見た目がぐちゃぐちゃになってしまうことがよくあります。しかし、Nano Banana ProはGeminiの強化された多言語推論機能によって、カレーの作り方の例でも示された通り、画像に書き込まれる文字がより正確になり、崩壊しにくくなっています。これにより、複数の言語でテキストを生成したり、文字の含まれた画像コンテンツを翻訳したりできるようになるとのこと。
Googleは、Google広告の画像生成機能をNano Banana Proにアップグレードし、GoogleスライドとGoogle VidsのWorkspaceユーザーにも展開すると発表しています。
なお、Googleは画像がAIによって生成されたものであるかどうかを見分けるため、Nano Banana Proで生成した画像にはC2PAメタデータが埋め込まれるほか、Geminiでウォーターマーク(電子透かし)のSynthIDをチェックするようになったことを明らかにしています。
この記事のタイトルとURLをコピーする
元の記事を確認する










