初体験:画像生成AIモデル"Flux"を搭載した"KREA AI"を使ってみる
"Black Forest Labs"によって開発されたText to ImageのAIモデル"Flux"搭載の"KREA AI"
前回の記事で、Image GenAI(画像生成AI)って今やたくさんあって、使ったことないもの、けっこうあるよなあ、という話をした。いや、ほんとたくさんあって、使いきれん。
その内容は以下の記事にあるので、興味があれば読んでね。
というわけで、今回もまだ使ったことのない画像生成AIをはじめて触ってみようと思う。
Text to ImageのAIモデル"Flux"
使ってみるのは、ドイツのフライブルク・イム・ブライスガウ(Freiburg im Breisgau)に拠点を置くスタートアップの"Black Forest Labs"(ブラック フォレスト ラブス)が開発した"Flux"(フラックス)というText to ImageのAIモデル。
このモデルを導入しているサービスはいくつかある。
スペインのアンダルシア州マラガ(Málaga)に拠点を置く"Freepik"(フリーピク)のGenAIにも導入されているし、
例の"X"(エックス)のGenAIチャッ
トボット"Grok"(グロック)にも採用されているようである。
ぼくはまだ、FreepikもGrokも使ったことがないが、今回使ってみるのは、サンフランシスコに拠点を置く企業の"KREA AI"(クリア エーアイ)というサービス。
"KREA AI"(クリア エーアイ)を使ってみよう
さて、まずはスタートダッシュとして、以前Midjourneyの検証用に作成した、クソ長いプロンプトが受け入れられるのかどうか、そこからはじめてみよう。
基本的な内容は、「コンクリート打ちっぱなしの部屋にいる女性のポートレイト」である。
はい、ちゃんと生成してくれました。そしてクオリティはかなり高いです。
生成サイズは、16:9の比率で1376×768、1:1のSquareだと1024×1024、アップスケールは出来ないようである。(追記:あとで気が付いたけど、アップスケール出来るっぽい)一度に4枚生成できる画像にはVariationボタンが表示されるので、気に入った画像のバリエーションが生成できるみたい。
ぼくが最近よく使っているMidjourneyにて、同じプロンプトで生成したものはこちら。
趣はだいぶ異なる。例えるならば、撮影したカメラマンが違うってところかな。女性のチョイスとかも含めてそんな感じがする。ただそういうことを抜きにして考えると、ぼくが使ったことのあるImage GenAIの中では、Fluxはかなりクオリティ高いんじゃないだろうか。
では、もう少し複雑なシチュエーションを生成してみよう。
昨日、Googleの"ImageFX"(イメージ エフエックス)をはじめて使ってみたんだけれど、その時のシチュエーションに合わせてみよう。
KREA AIで「ゾンビ」を生成してみる
では段階的にゆこう。
まずは単純に、「アメリカ南部の崩壊したショッピングモールをゾンビが徘徊している」というプロンプトを投げてみる。
よいですねえ、クオリティ高い。
あとでMidjourneyでも同じプロンプト試してみなきゃ。ここまでリアルに生成されるかなあ・・・Midjourney。怪しい気がしてきた。いろんなGenAIで同じプロンプトを試してみないと、それぞれの力量がはかりにくいよなあ。もちろん、それぞれにプロンプトの理解と許容の好みとか癖があるだろうから、一概には言えないけれど。
さてこのゾンビシーン、難を言えば、みんな長髪でみんなジーンズを履いてる、みたいなことになっている気がする。男女はいるけれど、みんな同じに見える。「アメリカ南部」ってプロンプトが効いてるのだろうか?そこで、少しプロンプトを調整する。
男女のほか、年齢層、そしてファッションに多様性を加えてみると、ちゃんと生成されている。ディテールもよい。子どものゾンビのロングTシャツのデザイン、なんて書いてあるんだろう?気になるなあ。
さらに難を言えば、みんな同じように歩いてこちらに向かってきている。アングルの問題もあるし、アクションの多様性の問題もある。ただし、ゾンビの行動スタイルとして、みんな同じように黙々と歩いてくる、というのはもしかしたらGenAIがあえてそう表現している可能性もある。
けれどもう少し調整してみよう。
KREA AIの"Add Style"機能
いま気が付いたんだけれど、KREA AIには"Add Style"という機能が付いているようである。あらかじめ用意されてる様々なスタイル参照を利用して画像生成が出来るみたい。"Random Style"ボタンでランダムにスタイルを付与できるし、自分で好みのスタイルを探して付与することもできる。
"Adobe Firefly"(アドビ ファイアフライ)のスタイル参照のような感じなのかな。
今回は画像を作り込まないのでスルー、また別な機会に試してみよう。
では話をゾンビに戻して、もう少しブラッシュアップする。ゾンビの肉体のヴィジュアルと行動の多様化、そしてショッピングモールのディテール強化。さらに画像の比率を2.35:1のシネスコープにしてみました。
行動はあまり多様にはなっていないが・・・、いろんな要素を詰め込んでいっても、クオリティがさほど劣化しないのは、なかなかすごいね。
ちなみに、Free Planでは、1日に6回までしか生成は出来ないみたい。つまり、24枚の画像が生成可能ってこと。有料の上位プランは3種類ある。
KREA AIは他にもいろいろ出来る
KREA AIには、"Image Generate"の他にも、"Realtime - Instant AI generation"、"Enhancer - Upscale images & videos"、"Video - AI video generation"など、いろいろ出来るっぽい。動画も生成できるんだ!
さっきアップスケールは出来ないって書いたけど、Enhancerを使えば、たぶん出来るんだね。
きょうはお試しなので、改めてKREA AI特集を組んで、今度いろいろ触ってみようかな。
いずれにせよ、Flux、侮れんな!
今回は、ここまで。