AIでお絵かきすること・・あれこれ
AIで作画するとき、作風を研究するのは大切だよ、って言いたいことが結論。・・私的には、です。
私が最初、お絵かきAIをはじめたのは、DALL とLeonardo ai である。
DALL は、Chat GPT のとこのお絵かきソフト。どちらも有料で両方同時にはじめた。いろいろと作画していたんだけど、どちらも問題があったので
Stable Deffusion に鞍替えした。実は後で知ったことなんだけど、Leonardo ai は、Stable Deffusion にあれこれ手を加えた物だった。Stable Deffusionを使い始めてLeonardo aiを全く使わなくなった。1年間契約したのにもったいない・・
Stable Deffusion と DALL および Leonado.ai とは一体何が違うのか?
一番の違いは、オンラインなのか、オフラインかの違い、という点である。
ダリとレオナルドは、サーバにアクセスして作画する。
一方、スティブル・デフュージョンは、自分のパソコンにプログラムを入れて作画する。これが大きな違いなのである。
私が自分のパソコンに入れるタイプのお絵かきAIを選択した理由は、"自由"を得るためだった。
サーバ上で操作するAIお絵かきソフトは、公序良俗に反する作画を拒否する。
名誉の為に一言。キータンは別に公序良俗違反をしたいわけでは無い。
ある日、ダリ を使っていたとき、ミロのビーナスを超える大理石の彫刻にチャレンジしてみた。しかし、ダリ からは作画を拒否られた。???
当初なぜか不明だった。よくよく考えてみると・・私は、トルソと入力したのだが、要するに彫刻 作品(人体)で, 頭部 や腕,脚などを欠いたものを指す言葉なんだけど・・それが「ハダカ」という事で作画をしてくれなかった。
私にとって非常にショックであり、不便であった。さらに、なぜか「イシュタルの女神」という事を書くと作画を拒否られた。何か特別の意味づけでもあるのだろうか? レオナルドも似たり寄ったりで不自由を感じ、結局 スティブル・デフュージョンに乗り換えた。こちらはハードルが高かった。
まず、パソコンのグラフィックカードを交換しなければならなかった。最低12GBのグラフィックメモリが必要とのことで、中古だけど大枚はたいて買いました。
次に、AIプログラムをダウンロードしてその設定に1日を費やした。
サーバ上で動くお絵かきAIは、あえて言えば、もうすぐ料理が出来上がるから塩とコショウを自分で入れてね。それで完成!! といった感じ。
ところが、スティブル・デフュージョンは、料理を作るには先ず、薪を拾って来て火をつくりましょう・・という所からはじめるわけ。
要するにマトモな作画をさせるまでの下準備が必要な上に作画の為のプロンプトを呪文とも呼ぶが、要するにAIに対する指示もアレコレ細かい指示が必要。ダリなんかは、ある程度適当な指示でもそれなりに説得力のある作画をしてくれたけど、スティブル・デフュージョンの場合は、その為の下準備が必要。まぁ、それが "自由" を得るということなのだろう。
それが目的では無いが、実際問題、公序良俗に違反する例えばムフフな画像も自由に作れる。違反はしてないがアマゾンのkindle 本に掲載されているAI 画像本を見れば一目瞭然である。まぁ、皆が皆、同じような女性の水着姿の画集をだすもんだから、ビジネス的には過当競争ぎみであり、いかにもAIで作りました、という顔ばか見せられると・・キンタロウ飴そのものである。もちろん、その様な熱意は認めますよ。でないと人類が滅亡するかもしれないから。
本題に入るまでの経緯が長くなってすみません。
本題は、作風の話。
お絵かきAIに絵を描かせるには、いろいろな条件を入れる。
次の絵が、ステイブルデフュージョンの画面。
いろいろとボタンが並んでいるけど、基本は、❶に作りたい絵の指示を書いて、❷の「生成」ボタンを押すだけ。
試しに、❶に " 1 girl" と入れて❷を押すと以下の様になる。
女性の絵が出てくる。
そして、❸のボタンに注目する。
❸は、「チェックポイント」と呼び、ここを押すとチェックポイントのリストが出てくる。
チェックポイントとは、学習済のモデルファイルの事である。
膨大な時間をかけて学習させたモデルで、これには大きく分けて、実写とイラストの2種類に分けられる。
さらに、東洋人や西洋人の大きなくくりから、日本人やインド人などのモデルもある。これらのファイルは、https://civitai.com/models というサイトからダウンロードしてくる。
膨大な量のチェックポイントがあり、人以外でも動物やモンスターなどもある。
このチェックポイントを変更するだけで、同じ "1 girl" でも違う絵が出てくる。
例えば、
againmixmr_v10
というチェックポイントで " 1 girl " を実行すると、
raemumix_v90
の場合は、アニメ風となる。
さらに、dr34m_puff の場合は、欧米風の実写? デッサン風の様にでてくる。
故に、自分がどの様なタイプの人物を描きたいのか大枠を決めてチェックポイントを選択することになる。
その上で、作風 を含めたのプロンプトを❷に入れる。
作風とは、どの様な雰囲気で描くのか、という事である。
例えば、シャガールやゴッホの様な感じに描くとか、先人のスタイルの事である。先人とは言わないまでも、例えば、ルネッサンス風とか大正ロマン風とかでも良い。では、試しに上記のdr34m_puff の "1 girl" を
1) シャガール Marc Chagall Style
2)ゴッホ Van Gogh Style
3)ルネッサンス風 Renaissance Style
4)大正ロマン風 Taisho Roman Style
で絵を出してみる。
結果は上から・・
作風の指示だけでこれだけ変化する。
そしてさらにこれらをミックスする事も可能である。
シャガールとルネッサンスをミックスしたらどうなるのか?
この様に両方のスタイルが混ざってくる。
そうすると、複数のスタイルを融合させると、独自のスタイルが生まれるかもしれない・・と推測できる。
もちろん、一般的には、肌の質感はどうの、アイシャドウの入れ方は、ハイライトは何処に入れるとか、日々プロンプトの並べ方などを四苦八苦しているわけで、もちろんそれらも大切なんだけど、それ以上に全体の雰囲気を決めてしまう「作風」というものにも関心を持つべきだと思う。
その上で、化粧は? 衣装は? ライティングは? という問題に取り組んでもらいたい。
作風の引き出しが多いほど出来上がる絵の幅がひろがると思う。
それでは最後に、そんな作風を意識して作画した画像をお楽しみください