
【Stable Diffusion】 MEMEを学習させたモデルでのアウトプット検証
昨今話題の画像生成AI『Stable Diffusion』で、Virtual Human”MEME”を使い様々な出力をテストしましたので、今回はその結果を共有していきます。
(MEMEは弊社で制作したオリジナルのVirtual Humanです。)
MEMEを学習させる
Stable Diffusionにはモデル(※)と言われる脳の様な役割を果たすものがあります。
初期設定では”v1-5”という「全体的に学習のカバーはできているがあまり質が高くない画像が出力されるもの」になっています。
そこで、アニメ調の画像にしたければ”Brain Dance”、欧風美女のリアルな画像であれば”Realistic Vision”など、モデルによって得意不得意があるので目的に合わせたモデルの選択が重要です。
今回はMEMEを生成するにあたって、リアルなアジア人美女が生成可能な”BRA”というモデルを使って生成しました。
(※モデルとはあらかじめ画像の風合いやタッチが学習されたファイルのこと)


特定のキャラクターを生成させたい時には、学習ツールを利用してAIに学習させる必要があるのですが、学習のさせ方については下記の記事を参考にしてみて下さい。
①ファッションに関するプロンプトでの変化

まず、衣装に関してです。
”Denim style”や”Hippie fashion”、”Bling Bling”(Hip Hopカルチャーにおける大ぶりなアクセサリーのスラング)など、抽象的なプロンプトでも生成される画像には反映されているので、サブカルチャーやアングラな要素への理解や認識も深い所にありそうです。
”Yukata”や”Leather jacket”の様な具体的なプロンプトは安定して生成が可能です。
では”PRADA”の様にブランドの細かい指定はどうでしょうか?
結果としては、そのブランドの特徴が拾われ、そのブランドらしい雰囲気の服を着てくれました。
しかし、大きな特徴がないブランドやデザイナーによって作風が大きく変わるブランドに関しては、大まかな雰囲気しか出せず分かりづらい結果となりました。
②フォトグラファー/アーティストをプロンプトに追加したときの変化

フォトグラファーの名前のプロンプトを入れることによって、生成される画像にそのフォトグラファーの特徴やパース感・色味などが反映されました。
”Mika Ninagawa”であれば彼女の代名詞である花柄やカラフルな色使いが反映され、”Ryan McGinley”であれば美しいライティングになります。また、"Tim Walker"はどこかドール顔っぽい雰囲気になりました。
アーティストも同様で、ポップアートであればそのアーティストのキャラクター性や色使いが反映され、衣装もその特徴を拾ったものになりました。
③シチュエーションをプロンプトで指定したときの変化

では、シチュエーションのプロンプトに関してはどうでしょうか?
有名な建造物やスポット、例えば渋谷のスクランブル交差点やエッフェル塔などであれば生成された画像に見覚えのある建物や景観が反映されます。
しかし、パリやロンドンなどの地名だけでは大まかな雰囲気しか反映されず、満足いく結果にはなりませんでした。
冒頭でも述べた通り”BRA"は人を出力することに特化したモデルなので、背景をこだわりたいのであれば、使用するモデルを変更する必要があるかもしれません。
④AI特有のエラー表現

今までお見せした画像の中に違和感のある画像が混ざっていたのですが、皆さんお気づきになったでしょうか?
実は、いい雰囲気の画像なのにエラーが起きていたのです。
明確に表現したい構図やポーズある際に、エラーばかり発生するとなかなかフラストレーションが溜まりますが、エラーも悪いことばかりではありません。
例えばデニムジャケットも見たことのないパターンであったり、MEMEの顔が二つ出てきて胴体がぐにゃぐにゃに歪んでいたりと、AIによるエラーは今までに見たことのないAI特有の面白い表現を見せてくれてます。
人間では思いもつかないような表現方法がAIのエラーによって偶発的に生み出されることで、人間の作り出すアートとは別軸の新たなアートとして捉えられると思います。
まとめ
今回はMEMEを使い、様々なシチュエーションや条件のもと画像を生成して
みましたが、結果としては正確なプロンプトを用意する事によってある程度コントロールすることができ、想定していたよりもいい構図や新たなアイディアの発見がありました。
今回のテストを通して得られたものは、以下になります。
アイディアの事前テスト
撮影やCG作成の削減による製作のコストカット
人間では思いつかないようなアイディアを得られる
新たなアートとしての可能性
広告クリエイティブとしての活用の可能性
今後の活用の場としては、以下のようなものが期待できるのではないでしょうか?
イベントで体験型デジタルコンテンツを用意し、学習したデータを使って体験者をキャラクターに変身させられるフォトブース
特定の人物やキャラクターを学習させたデータを用意し、WEB上で誰でも簡単に生成することができるようにすることで、二次創作物をSNS拡散させるCGM型のキャンペーン
アタリでは、この様なAI を使用したクリエイティブの可能性を日々模索しております。
何かAIを使ったコンテンツや広告制作のご要望があれば、ぜひお気軽にご相談ください。
<お問い合わせはこちら>