
Flux.1とかいう新しい画像生成AIのモデルのすばらしさを皆様にも知っていただきたい。試し方もあるよ!
※ この記事内の生成画像はすべて Flux.1 Schnell で生成した無加工品です
というわけで Flux.1 という新しい画像生成用のモデルが出てかなり面白い!っていう話です
例えばこんな感じの画像とかが簡単に作れます
白いスタジオに置かれた一本のシイタケ。
— ぶるぺん/blue.pen5805 (@blue_pen5805) August 6, 2024
ここでのルールはただ一つ。
一発採りのパフォーマンスをすること。 pic.twitter.com/HbkhJLBBuV
みんなもアルパカを育てよう pic.twitter.com/0H2GITPeVR
— ぶるぺん/blue.pen5805 (@blue_pen5805) August 2, 2024
ただし!
いわゆる美少女AIイラスト的な画像はたぶん満足いくレベルのものは作れません!
でも面白いから!美少女以外をたまには生成してもいいじゃない!

Flux.1 って何?Stable Diffusion と何が違うの?
全然よくわかりませんがたぶん Stable Diffusion の親戚あたりです
2024年8月7日時点ではいわゆる webui では使えません
より詳しく知りたい方はこちらの記事あたりを読みましょう!
特に実写風の写真やアートっぽい画像において現状最高峰の画像が生成できます
そして Stable Diffusion のように、モデルがダウンロードできるので自分のパソコン上で動かすことができる!(※)
つまり、めちゃくちゃ適当なことを言うと Midjourney が無料で使えるみたいなイメージですね。適当すぎ?
※ 動かすことができないパソコンもあります

何がすごいの?
かなりキレイだしある程度までなら無茶振りしても応えてくれます!多分!
公式の告知ページには以下の特徴が書かれています!
2024年7月時点で画像生成AI界最強の性能
Midjourney-v6.0 や Stable Diffusion 3 Ultra、DALL-E 3、全然知られてないけど超強い Ideogram と比較して同等、あるいはそれ以上のいい感じの画像が生成できると公式は言っております

「どっちのモデルの生成画像のがいい感じ?」っていうのを選ぶ対決をした結果のスコアのグラフ

↑ の2画像は https://blackforestlabs.ai/announcing-black-forest-labs/ より引用
実際のところは真面目に比較してないからわかりません
でもそうかもしれないと思わせるだけのパワーは感じます

なんか三種類あるっぽいけどこれ何?
FLUX.1 には pro、dev、schnell の3種類があります!
pro はプロ用なので課金しないと使えません!モデルも非公開!
dev が一番普通のやつです
モデルが公開されており、画像を生成するだけならは実質的にほぼ無制限で使えます!
schnell はちょっと品質が落ちるけど生成が早い!(dev の5倍~ぐらい)
こちらもモデルが公開されています
Stable Diffusion に詳しい人なら LCM とか Turbo/Lightning みたいなものと思ってもらって構いません
こちらは dev 以上にほとんど何も制限なく使えます!
でもお高いんでしょう?
ウェブでちょっと試したり自分のパソコンで使う分には無料です!
基本的にはね!

試してみよう!
さっきも言った通りウェブ上でも自分のパソコンでも試せます
自分のパソコン上で試す!
そのために必要なPCスペックはメモリが16GB以上で VRAM12GB 以上のグラフィックボードを搭載していること!
自分のPCがこれを満たしているかわからない人は!
…ちょっと難しいと思うので ウェブで試す のほうを見たほうがよいでしょう
実際のところこれ以下のスペックでも動かすことはできると思いますが、生成に時間がかかったりするのであんまりおススメはしません
あとプロンプトは自然な英語の文章にするといいと思います!
ChatGPT にお願いしよう!
自分のパソコンで試す
説明を書くのも面倒だし読むのも面倒だと思うのでできるだけ短く!
生成には ComfyUI を使います!インストール方法は…調べてください!
以降、ComfyUI のインストールは終わっているものとします!
サボりじゃないぞ!
まず、モデルファイルをダウンロードします
dev と schnell がありますが schnell のほうが手軽なのでこちらで説明します
以下のページ を開いて画面中央あたりにある download のリンクからファイルをダウンロードしてください
(ちなみにこれは fp8 版っていう性能わずかに下がるけど容量半分なやつ)
ダウンロードが終わったら flux1-schnell-fp8.safetensors を ComfyUI があるフォルダの中の models フォルダの中の checkpoints フォルダに移動させてください
で、ComfyUI を起動して以下のワークフローファイルをダウンロードして読み込んでください
するとこういう神がかり的にわかりやすいワークフローが表示されます

右下のコアラが出てない?Queue ボタンを押しましょう!
パソコンの性能によりますが数秒から数十秒でコアラ寿司が湧いてきます
これで準備は完了しているので、適当にプロンプトのところを変えて生成してください!
画像サイズは 0.1メガピクセル (320x320ぐらい) から 2メガピクセル (1920x1080ぐらい) の間なら様々な比率で安定して生成できるらしい!

ウェブで試す
そんなパソコン持ってないよ!
ご安心ください。オンラインで使う方法もあります!
一番簡単なのが公式の Hugging Face Space です
プロンプト入れてちょっと待てば画像が生成されると思います!完全無料!

ほかにもいろんなところにあるので探してみてね(Civitaiでもできる)
弊 Discord サーバーでも生成 Bot 動かしてるのでお試しいただけます
(ただし意味不明な画像が強制的に目に入るので気分を害す可能性があり)

ライセンス…?とかいうのがどうせややこしいんでしょ!
そうでもない!
dev も schnell も生成した画像に関しては全く制限はないと考えていいと思います
正確には、
dev は FLUX.1 [dev] Non-Commercial License で、モデルの商用利用に対する制限、モデルの出力物を競合モデル(Stable Diffusionとか)の学習に使うなみたいな制限とかがあります
ただし、ここでいうモデルの商用利用はモデルを使った画像生成サービスとかのことであり、出力した画像自体は商用利用を含む様々なことに使っていいと明記してあるので気にする必要なし!
schnell は Apache License 2.0 で、めちゃくちゃ雑ですがほぼなにも制限ないみたいなもんです!
つまり!画像生成して遊ぶ分にはなんも気にしないでヨシ!

まとめ
お分かりいただけただろうか?
お分かりいただけた方も、お分かりいただけなかった方も、とりあえず試していただければ幸いです
ここで終わり
かと思いきや、この後に本編があるので暇な人は見ていってください!
余談
この FLUX.1 を作った会社
次はテキストから動画生成をするモデルを出す予定らしいです!
(公開されるか、されたところで動かせるのかは別として)
告知ページがカッコいいぞ!
以下、Flux.1 の生成画像が大量にあるだけ
本編です
画像を大量に貼る大義名分を作るためだけにここまでの内容を書きました
ここから先にあるもの
それは弊 Discord サーバー内の生成Botで自分を含むサーバー内の誰かが生成したイケてる画像たちです
(生産者の名前はプライバシーに配慮して伏せさせていただきます)
これらを見て Flux.1 のすばらしさを体感していただければ幸いです
よろしくお願いいたします
注: ちょっと下品な画像が一部含まれています

























これらは一部なので、もっと見たい人は Discord サーバーに来てね!