AIGC:COLOR EXHIBITION(August)投稿作品の作成過程解説【StableDiffusion】
1.AIGC:COLOR EXHIBITION(Aagust)
先月に引き続き開催されました。今月のテーマは「GOLD」でした。
当日の参加者による作品は運営アカウントから順次投稿されました。
Twitter(X)上で以下で検索すると探しやすいと思います。
2.今回の投稿画像(8/26)
私からは今回は以下の画像を提出しました。
(もしかしたら読み込みに少し時間かかるかもしれません。その場合は少々お待ちいただくか、画像部分をクリックするとご覧になれると思います。これでも実際の画像より少し画質を落としています…)
かなり縦長の画像にしてみました。
サイズは横3,072×縦16,224です。
テーマのGoldを全面に入れつつ、5階層に分かれています。
各階層には人物(Girl)とともに、生物モチーフのオブジェクトがあります。
各階層を上から、龍、猫、鳥、狼、蝶となっています。
3.最初の想定イメージ:クリムト風
元々作ろうと思っていたのは、上記の画像とは違う方向性のものでした。
テーマGoldとなりまずイメージしたのは、グスタフ・クリムトの絵でした。
クリムトについては以下が参考になります。
また以下はクリムトの絵の特徴をChatGPTにまとめてもらったものです。
クリムトの作風をイメージした習作をいくつかここに掲載(供養)します。
さらにクリムトの作品としてイメージしていたのは
「ベートーヴェン・フリーズ」
という作品です。
これは現物は壁画となっており、横長の壁に様々なモチーフが描かれ、また前述した象徴的・抽象的な特徴もよく表れている作品です。
この作品については以下が参考になると思います。
このイメージから、今回の投稿作では(Twitter・Xの投稿向けとして)縦長の画像にできないかと考えていました。
※以前、クリムト展でレプリカを見たことがあり、印象深い作品でした。
その他にも、特に有名な作品である「接吻」や、「女性の三時代」「ユディト」「アデーレ・ロッホ=バウアーの肖像Ⅰ」などの金を用いた作風もイメージしていました。
なお、生成に当たってはControlNetのTileも使用しています。
元画像はibisPaintというアプリで、金や黒背景、装飾が入ってほしい部分を指定するような画像を自作しています。
また途中から、前回と異なる試みとして同じくControlNetのOpenPoseも使用しました。
拡張機能のOpenPoseEditorを使用してとってほしいポーズを作成し、MultiControlNetにて入れました。
ただそれでも、イメージしている金の部分が抽象的な形なので、なかなか思った通りにならず、苦戦していました。
4.モチーフ変更
いまいちピンと来ない中、モチーフ変更を思いついたきっかけは以下の2枚でした。
1枚目では、鳥(の頭部。首から上?)が偶然出てきました。
偶然とは言っても、Tileで入れた画像ではこの形を作っており、特になんのモチーフということではなく抽象的な金の彫刻を入れる想定でした。
また2枚目では、中央から上部にかけての金の装飾がなんとなく犬・狼に見えました。これもTile用の画像が効いてそうなのですが、この部分は黒い背景部分の想定でした。しかしTile画像とプロンプトとが相まって、周囲よりも暗めの金の装飾として生成されました。
この2枚きっかけで、他にも金の生物を作ってみようと考えました。
そのため残りの3枚(猫・蝶・龍)は最初から意図的に作った形となります。
5.各部分の修正
(1)鳥:中央
ここはほぼ元の画像のままですが、左手だけ変だったのでinpaintで修正しました。
(2)狼:中央下側
ここは狼(犬ではない)に見えるだけだったので、しっかり狼の顔になるようにここもinpaintで修正しました。
いい感じに浮かび上がって、目つきに不気味さも出ました。
(3)猫:中央上側
猫の修正前後の画像はこちらです。
猫部分の主な修正点は、手・腕・左下の猫です。
明らかに右手が2個あるので、下側の方をinpaintで消しました。また消した腕の延長線上も変なので同時に修正しています。
また左下の猫は、生身っぽかったので、金になってもらいました。毛並みもちょっと逆立っていい感じになりました。
(4)蝶:最下段
蝶の修正前後の画像はこちらです。
こちらは手・顔・髪形を修正しました。
左手ももう1本指が見えてもいいかなと思いましたが、あまりいい修正結果が得られなかったのであまり変えませんでした。
髪形は、実は元の生成時にいろいろ変えるのを忘れてしまっており…。
ここで少し動きをつけるようにしました。
(5)龍:最上段
蝶の修正前後の画像はこちらです。
こちらの修正点は顔と左手です。
形の修正+龍を従えてる感じにしました。
右の龍の口が異形ですが、これはこれでありだなと思い、そのままにしました。
6.完成まで(合成・サイズ調整)
出来上がった各部分を、Photoshopで合成しました。
合成時には、間を300pxほど空けて配置し、その間をGenerativeFill(生成塗りつぶし)の機能を使い隙間のつなぎを生成しました。
また、中央の3枚は左右両側に256pxずつ拡張し、そこも再生成しました。さらに最上段、最下段の2枚も、各上下に256pxずつ拡張・生成しました。
その上で全体のバランスを見て、つなぎ目や細部を若干修正しました。
そして、最後に全体のサイズを2倍に拡張し、ロゴを追加して完成となっています。
7.おわりに(感想・お願い・次回予告)
今回は、抽象的な金の彫刻や背景をイメージ通りに作ることにかなり苦戦しました。抽象的なものをTileやプロンプトで指定することは難しいですね。(単に技術・知識不足かもしれませんが)
基本的に思った通りにならないので、途中からCFG Scaleを5.5~6にすることであえて結果をばらけさせて、いい感じの抽象的オブジェクトができないかと思い生成していました。
その一方で、人物の配置・ポーズはイメージから逸れないようOpenPoseEditorを使用して生成結果の散らばりを抑えました。
さらに生物モチーフも取り入れることで、抽象と具象を織り交ぜた画像を作ることができました。
<皆様へのお願い!>
ほぼ趣味で(※)やっているとはいえ、生成環境の維持費用(私の場合は主にColab利用料)が馬鹿にできなくなってきました。
(※仕事でも生成AI関連に関わるので、その勉強も兼ねて始めました)
もしよろしければ、本ページ下部の「気に入ったらサポート」からご支援をお願いいたします!
そして次回のCOLOR EXHIBITIONは9/30です!
(おまけ1)その他候補作画像
候補作となったもののいくつかを追加で掲載(供養)します。
(おまけ2)OpenPoseEditor画像
各画像用に作成したopen poseの画像です。