新しい画像生成AI、FLUX.1の使い方
[読了目安: 4分]
NO AI(人間が書きました✍️)
AI系ポッドキャスト(耳で学ぶAI)運営の矢野哲平(@robothink_jp)です。この記事では新しく登場した画像生成AIのFLUX.1を試してみます。
ポッドキャストでも話しました。音声で聞きたい方はこちら。
👨💻対象読者
- 画像生成AIに興味がある
- または画像生成AIを使ったことがある
🎉記事を読むとできること
- FLUX.1について知ることができる
- FLUX.1を使う方法を知ることができる
FLUX.1
2024年8月に新しく登場した画像生成AIです。開発はBlack Forest Labsという会社で、なんとStable Diffusionの開発者が立ち上げた企業でもあります。
現状モデルは3つ。Pro, dev, schnell(シュネル)です。
ProはFLUX.1の最高モデルであり商用利用も可能。
devは非商用向けのモデルで個人利用や開発者向けでしょうか。
schnell(シュネル)はドイツ語で「速い」のような意味。FLUX.1の中での最速モデルです。ローカル開発と個人的な利用のために調整されています。
FLUX.1を使う
FLUX.1を使うには大きく分けて2つの方法があります。自分のパソコンで環境を整えて使用するか、オンライン上で使用するか。
この記事ではオンライン上で簡単に試せる方法を解説します。
オンラインで使用する場合、Hugging FaceかReplicate、fal.aiの選択肢になります。
Hugging Faceならログイン不要でそのまま試せます。ただし、モデルはdevかschnell(シュネル)になります。
ちなみに、Advanced Settingsからアスペクト比など色々細かい設定ができます。Number of inference stepsを大きくすると品質が向上しますが、生成まで時間がかかるようです。
Replicateやfal.aiではGithubアカウントでのログインが必要になりますが、個人的にはfal.aiがおすすめです。(無料で利用できる枠が多い)
ちなみにAPI経由で画像生成する場合、1枚あたりの金額はおよそ8円ほどです。
Midjourneyの場合、月額10ドルで200枚までなので大きくコストは変わらない感じでしょうか。
FLUX.1はAPIがあるのが良いと感じました。ちなみにMidjourneyは"公式"のAPIはありません。
XからもFLUX.1を使える
Xプレミアム以上のユーザーが対象になりますがX上からGrokにアクセスすることでFLUX.1の画像生成を使えます。Grokはイーロンマスクが設立したxAIというAI企業のプロダクトです。会話型AIですが8月14日のアップデートで画像生成もできるようになりました。
Perplexityからも使えるように
※ちなみにPROプラン(月額20ドル)のみです
所感
なんと言っても人物画像ですね。かなりクオリティ高いです。
ピクセルアートもまずまず。
一方でアニメ風のイラストはMidjourneyに比べると若干弱いと感じました。
ちなみに画像への文字入れも得意とのことです。(メニューにFlux.1と入れています)
今まで人物画像の生成と言えばMidjourneyが強かったですよね。
ですがFLUX.1も侮りがたし、です。
日本語で試す
日本語でも生成できます。が、ハルシネーション率が驚くほど高いので英語推奨。
同じプロンプトを日英両方で試してみた結果です👇
全く違う画像になっていますね…🤔
利用規約
最後に利用規約周りについて触れます。公式サイトの利用規約にはいろいろ書かれていますが、かいつまんで説明すると
画像の所有権はユーザーに帰属
似たような画像が出力されてもユーザー間で所有権を主張しない
第三者とトラブルが起きた場合はFLUX.1側は関与しない
こんな感じです。会社側はユーザーが生成した画像に関して所有権を主張しませんし何かトラブルがあってもユーザー側で解決してね、というスタンスです。
【note読者限定】生成AIのおすすめツールの資料を配布中
生成AIツールは何を使えばいいか分からない
もっと業務効率化に貢献するツールを知りたい
ChatGPT以外のAIツールを知りたい
こういった声に応えておすすめの生成AIツールを解説する資料を制作しました。もっとAIの情報をキャッチアップしたい人はぜひご覧ください。
👉資料を受け取る
noteでも月に20本ほどAI関連の記事を投稿しています。フォローよろしくお願いします😼