生成AI関連情報(2024/08/21) FLUX.1 関連調査 / マクドナルド生成AI利用施策など
ここ数日も色々と生成AI関連情報のリリースや記事が上がっていましたね。今日はちょうど調べていたFLUX.1関連の情報と、各社等で出てきた生成AI利用施策関連の情報がありましたのでそちらをまとめてみました。
FLUX.1 関連
Stable Diffusion WebUI ForgeでFLUX.1を動かしてみた
量子化されてるモデルファイルがあるのでなんとか動かせそうですが、Devで12GBと結構でかい。ちょっと時間を見つけて自分の環境でも動かしてみようと思いますが、RTX4070 12GBでギリギリぽい?から動かない気がする…。
Stable Diffusionの失敗を元にFLUX.1はどのように?
FLUX.1自体がStability AI(Stable Diffusionシリーズ)出身の人達で作られたものなので、そこの学びは活かされている感じですね。これを読んでなるほど考えてるなと思いました。
提供しているモデルの種類と制限
(Pro>Dev>schnellの順にモデルサイズ(=品質)が下がる)
Pro
モデル及び修正版/派生物の商用目的利用:(そもそもできない)
生成物の商用利用:OK
利用方法:提供されているAPI経由のみ
Dev
モデル及び修正版/派生物の商用目的利用:NG
生成物の商用利用:実質OK?(生成された画像に対する所有権の主張をしないので)
利用方法:モデルダウンロード
schnell
モデル及び修正版/派生物の商用目的利用:OK
生成物の商用利用:OK
利用方法:モデルダウンロード
ここから言える事として、Devを使って画像生成したものはほぼ使えるんですが、例えば企業がFLUX.1を使った画像生成を入れたサービスを作ろうとすると課金が発生するという仕組みですね。ユーザーコミュニティとしてはSD系のような流れがDevベースで発展していくといい感じかも?
普通にDevの商用利用というのが「生成物の」という方かと思ってたんですが、そっちじゃなければいいかもですね。
FLUXにControlNetを適用させる
これも早くも動き始めた模様。動きが早い。ただ、まだ使えるレベルではなさそう?と言ってる方もいますが結構ありますね…
こちらの動画では実際にControlNetのdepthを使う方法(Google Colab利用)を説明してますね。
実際に見てみたら、OpenArt Workflowsでもう結構出てました。Canny、Depthとかとか。ほかにも。
ちなみにノーマルでFLUXのNF4版を動かすものも。
FLUX.1 用のLoRAを作ってみた
FLUX.1のLoRA作成+利用してみた記事も上がっていますね。だいぶ盛り上がってきてるなぁ。今後SD系使ってる人たちは軒並みこっちに来るか…?
FLUX.1[dev]で生成AIグラビアをグラビアカメラマンが作ってみる
あとはこんな感じで実際に使ってみた話をテクノエッジさんでも。
それ以外の画像生成関連情報
Google 開発の画像生成AIモデル、"Imagen 3”は期待以下…?
Imagen 3はGoogle謹製の画像生成AIモデルです。
こちらに調査した人がいるのですが、規制項目が多すぎて全く使えない模様…。どうやらキーワードの何らかが反応して生成しないようにしてるぽいですね。
(これは過去記事ですが有効だと思ったので)人物や動物のポーズ構図を用意する時には3DCGツールを使ってベースを作ると良さそう
CreativeEdgeさんの記事を見てみたらこんなネタが上がってるのを見てなるほどね〜と感じました。確かに3DCG画像を作ったあとそれを参照させればいいということですよね。
3DCGのツールを使いこなす所に難しさはありそうですが…
生成AI関連の施策記事
マクドナルドの生成AIで作られた広告が炎上…?
東洋経済さんがまとめてますが、なかなか難しい?ようですね。ただ実際のツイートを見てみると否定的じゃないのもあったりするので取り方次第かな…。ちなみに、作成したのはKaku Dropさん