オーバーディフュージョン
小説「ニンジャスレイヤー」が作中人物「コトブキ」のイメージイラストを募集しており、AI作画でも可だったので、Stable Diffusionのtext2imgを振りまくって提出しました
で
「なんかイメージと離れすぎてるけどキャラは立っているんだよな」という用途不明の在庫ができたので、放出しておきます
以上
所感
〇prompt指定
・最初は「near-future park(近未来の公園)」に居ることにしてたけど、拳法とのかけ合わせで「太極拳をしてる年輩者」率が高かった。あとpark(駐車場)になったりもした
・次に「She is a character of anime(アニメのキャラクターです)」を指定した。顔やタッチなどフィクションらしくはなったものの、動きのない立ち絵が増えた
・次に「cel shaded CGI(セル画風CG、3Dモデルで演算されているが2D風に見せるCG手法) anime」と補足したが、あまり改善しなかった
・文章も長くなっていたので「anime~」を先頭に送ってみた。いつもは、キャラクターの行動や容姿より前に補足的な情報を置くとそちらに引っ張られがちなので避けていたが、これらはいわば画風、抽象的な情報だったからか、危惧したほど具体物と干渉せず、かつそれっぽくしてくれるようになった。
・最後に「cyberpunk anime」と追加した。これにより、サイバーアクセサリ的なものを勝手に足して不足していたアンドロイド性を補ってくれるようになったが、服はオーバーオールやジャージ(近代的な一枚着)に持っていかれがちになった。アニメ化の副作用であった動きの少なさは直った
・「light orange」でひとまとまりのつもりで指定したのに、「light」だけが「太陽光を浴びている」や「画面内に光源がある」のように誤解されたり、二つ入れた色「cyan」と「orange」の形容対象が頻繁に入れ替わったりと、あいかわらず、文章として練っても単語プールとしてしか読んでくれない感はつきまとう
・対策は、細部の描写をするのに判定の強い言葉を使わない、を心がける でいいのかなあ わからんわ
〇AI
・midjourneyしてたけどものすごく金がないので他のを探すことに
・Stable Diffusion Demo(タダだけど512pix四方限定で、マイナス指定なども不可)は、1回あたり4枚。体感5回に1枚ぐらい保存していたので、打率は約1/20で、1週間で2000枚作らせた計算になる
・img2img(自前 or 生成物を再描画)や俺自身による加工はめんどかったのでしていない
・Google Colaboratoryで、グラボ積んでなくてもGPU速度でstable diffusionとやりとりできた。1日python勉強すれば一度に30枚作らせてzipで落とすのも可能
・ただし、一回で大量に作れるということは、画像を見て俺からpromptへフィードバックさせるサイクルが鈍重になることも意味する。指定が悪くてもすぐには気付けないので、痛し痒し
・あとGoogle Colaboratoryは、俺からの応答が一定時間ないと実行状態が没収されるので、その意味でも大量生成には限りがある。(向こうのサービスの設計としては、もっと双方向で密な作業をしてほしいようだ)
この記事が気に入ったらサポートをしてみませんか?