高品質かつ高速な画像生成AI「FLUX.1 Kontext」が登場したので使ってみた、テキストと画像の入力に対応しアニメ風も実写風も生成可能 – GIGAZINE


画像生成AI「Stable Diffusion」の開発者らが設立したAI企業「Black Forest Labs」が、画像生成AI「FLUX.1 Kontext」を2025年5月29日にリリースしました。同時にBlack Forest Labs製のAIモデルを簡単に試せるウェブアプリ「FLUX Playground」も公開されたので、実際にFLUX PlaygroundにアクセスしてFLUX.1 Kontextを使ってみました。

Introducing FLUX.1 Kontext and the BFL Playground | Black Forest Labs
https://bfl.ai/announcements/flux-1-kontext

FLUX.1 Kontextは従来の画像生成モデルとは異なり、コンテキスト内で画像を生成するアプローチを採用しているとのこと。これにより、テキストや画像から視覚的な概念を抽出および修正することができ、一貫性のある画像生成が可能となりました。また、主要な画像生成モデルと比べて最大8倍高速に画像を生成できるとされています。

FLUX.1 Kontextは製品モデルの「FLUX.1 Kontext [pro]」および「FLUX.1 Kontext [max]」と、オープンウェイトモデルの「FLUX.1 Kontext [dev]」の3モデルが展開されています。FLUX.1 Kontext [pro]とFLUX.1 Kontext [max]はFLUX Playgroundで無料で試せて、画像を生成したり既存の画像を編集したりできるとのことなので、実際に使ってみました。

まず、以下のリンクをクリックしてFLUX Playgroundにアクセスします。

FLUX Playground – Black Forest Labs
https://playground.bfl.ai/image/generate


FLUX Playgroundを使うには、アカウントを作成するか、Googleのアカウントを利用してサインインする必要があります。今回はGoogleのアカウントを使いたいので、規約やプライバシーポリシーをよく読んでから同意のチェックを入れて「Continue with Google」をクリックしました。


使いたいGoogleアカウントをクリック。


「次へ」をクリック。


FLUX Playgroundの画面に戻ったら、もう一度同意のチェックを入れて「Get Started」をクリック。


これで画像を生成したり画像を編集したりといった作業が可能になりました。画像生成するには、画面上部の入力欄に生成したい画像の説明文(プロンプト)を入力すればOK。今回は初期状態でFLUX.1 Kontext [pro]を使える状態になっていました。


試しに「An old man drinking coffee by the window. The man looks out the window. Photorealistic.(年老いた男性が窓際でコーヒーを飲んでいる。男性は窓の外を眺めている。実写風。)」というプロンプトを入力して送信ボタンをクリック。


10秒前後で画像が4枚生成されました。


生成された画像はこんな感じ。カップの持ち手の位置が変ですが、それ以外の部分はかなり高クオリティです。解像度は1392×752ピクセルで、ファイルサイズは1.13MB。以下の画像をクリックすると、縮小前のオリジナル画像を確認できます。


画像の上にマウスポインタを合わせるとメニューが表示され、編集ボタンをクリックするとFLUX.1 Kontext [pro]を使って画像を編集できます。


「Turn a person into a young woman.(人物を若い女性に変更。)」と入力して送信ボタンをクリック。


若い女性に代わりました。カップの形状や背景などの人物以外の部分はそのまま維持されています。


「Change to Japanese anime style.(日本のアニメ風に変更。)」と入力するとこんな感じ。


「angry face(怒った顔)」と入力すると顔だけ変化しました。


英語はかなり高品質に処理してくれますが、日本語の理解力はかなり低いです。試しに「窓辺でコーヒーを飲む年老いた男性」と日本語で入力して画像を生成した結果が以下。窓もコーヒーも男性も描写されませんでした。


画像生成に使うモデルをFLUX.1 Kontext [max]に変更。


FLUX.1 Kontext [max]はテキストの描写が得意とのことなので、「Canned food labeled “GIGAZINE”.(『GIGAZINE』というラベルの付いた缶詰め。)」というプロンプトを入力して画像を生成してみます。


生成結果はこんな感じ。指示通りに「GIGAZINE」というラベルを描写できました。


日本語のテキストも描画できるか確かめるべく「Canned food labeled “ギガジン水産”.(『ギガジン水産』というラベルの付いた缶詰め。)」というプロンプトで画像を生成した結果が以下。漢字風の謎の図形が表示されました。やはり日本語は苦手なようです。


画面左側の「Edit」をクリックすると、FLUX.1 Kontextを使って既存の画像を編集できます。


今回は以下の写真を入力して、被写体の女性をカメラ目線に変更してみます。


まず、画像を「Drag and drop an image」と記されたエリアにドラッグ&ドロップします。


「tilt her head towards the camera(彼女をカメラ目線に)」と入力して送信ボタンをクリック。


カメラ目線になりました。


「Change season to winter(季節を冬に変更)」と入力すると、雪が降り始めました。


なお、FLUX Playgroundはクレジット制で、無料アカウントの作成時に200クレジットが割り当てられて処理内容に応じてクレジットを消費します。


クレジットは1000クレジット当たり10ドル(約1400円)で追加購入できます。


FLUX.1 Kontext [pro]とFLUX.1 Kontext [max]は「KreaAI」「Freepik」「Lightricks」「OpenArt」「LeonardoAI」「FAL」「Replicate」「Runware」「DataCrunch」「TogetherAI」「ComfyOrg」のサービスを通じて利用可能です。また、FLUX.1 Kontext [dev]はプライベートベータ版として一部のユーザーを対象に公開されており、一般公開後は「FAL」「Replicate」「Runware」「DataCrunch」「TogetherAI」「HuggingFace」で公開される予定です。

なお、Black Forest LabsはNVIDIAとの協力を進めており、2025年1月にはFLUXシリーズをGeForce RTX 50シリーズに最適化したことを報告しています。


また、AMDとAI開発企業のTensorStack.AIが共同開発しているAIアート作成ツール「Amuse」にも、FLUXシリーズをAMDプロセッサに最適化したバージョンが搭載されています。

AMDプロセッサ向けに最適化された画像生成AIと動画生成AIを含むAIアート作成ツール「Amuse 3.0」がリリースされる、ローカルで画像&動画を生成可能 – GIGAZINE

この記事のタイトルとURLをコピーする


ソース元はコチラ

この記事は役に立ちましたか?

もし参考になりましたら、下記のボタンで教えてください。

関連記事