画像生成AI「FLUX(フラックス)」リアル過ぎる!Midjourneyを超え
今回は「FLUX(フラックス)」と呼ばれる画像生成AIを紹介します。このFLUXというサービスは、画像生成AIで最も綺麗だと言われていたMidjourneyを超えたのではないかと、巷で噂されている画像AIサービスです。それがどんなサービスになっているのか、色々と紹介していきたいと思います。
今回は「Midjourney vs. FLUX」というテーマで、FLUXを紹介します。FLUXという画像生成AIを使って、テキストを入力するだけで生成された画像がこちらになります。
いかがでしょうか? 一目見ただけでも、そのリアルさが伝わるのではないでしょうか。
FLUXの実際の画面は、こちらになっています。
FLUXの性能
Webサービスとしてはまだ立ち上がっていませんが、オープンソースで皆さんに解放されている画像生成AIのようです。いわゆる、有名どころで言うとStable Diffusionと同じような仕組みです。一般にオープンに公開されている画像生成の仕組みが、このFLUXになっています。
他にも、こちらのページにはFLUXを使って生成された画像のサンプルがいくつかあります。実際に見てみると、かなりリアルです。草の感じや家が錆びついている感じも、非常にリアルに表現されています。
こういったアニメ調のものも生成できるようです。
見たことのない生物を作り出したり、文字も表示できそうですが、よく見るとやはり崩れています。ただ、英語の文字は比較的うまく生成できているようです。
さらに、この手指の描写が非常に綺麗にできています。
これには感動しました。非常にリアルな画像を生成できる新しい画像生成サービスです。SNSでも今話題になっています。
開発元は、Stable Diffusionの共同開発者が設立した「ブラックフォレストラブズ」という会社です。FLUXにはいくつかのモデルがあります。超リアルなプロ向けのもの、通常のもの、軽くて早いものなど、用途に応じた住み分けがされています。例えば、FLUXの最高性能のモデル「FLX1Pro」はAPI経由でしか使えず、商用利用が可能です。ただし、APIを使用するには申請が必要です。
「FLX1Deb」というモデルは、プロと同等の品質ですが、非商用利用に限りダウンロードが可能です。「FLX1schnell」というモデルは、最速かつ軽量で、Apache 2.0ライセンスで自由に使用可能なオープンソースモデルです。性能については、高品質な画像生成が可能で、プロンプトが非常に正確に反映されます。手が5本きちんと描かれるなど、背景の情景や複雑な場面の描写も得意です。手の描写が改善されており、Stable DiffusionやMidjourneyを性能面で上回ると言われています。
FLUXのモデルは、オープンソースライセンスで提供されており、特に最下位モデルの「FLX1schnell」は、個人利用から商用利用まで幅広く自由に使用することが許可されています。このモデルを使って、特化したモデルやサービスを作ることも可能です。
FLUXの概要は以上です。次に、FLUXのデモ環境で実際に画像を生成してみたいと思います。
FLUXの使い方
FLUXのWebページ
Schnell(最下モデル)お試し
Pro(上位モデル)お試し
ローカルデータ
今回は「Replicate」を使ってみたいと思います。実際に「cat」と入力して生成してみたところ、非常にリアルな画像が出来上がりました。
他のプロンプトも試してみましょう。今回は「ゴールデンレトリーバーが海で泳ぐ」というプロンプトを入力して生成してみたいと思います。
どうでしょうか。水の感じや、毛が濡れている表現が非常にリアルです。利用する際にはAPI設定が必要ですが、これを利用すれば簡単に生成できるようになります。
今回使用したのはFLUXのPro版ですが、Hugging Faceを利用すればAPI設定なしで最下位モデルを試すことができます。ただし、アクセスが多くて生成に時間がかかることがあります。