話題の画像生成AIで超初心者が少しでもマシな絵を作るために学んだことをまとめてみる

2022年8月3日 01:42

画像生成AI、流行ってますね！
カッコいいビジュアルがタイムラインを賑わしてますね！
私もこんなん作りたい！
AIならチョチョイのチョイっぽい！
チヤホヤされたい！
いやー未来万歳！

じゃ早速、私もカッコいいビジュアル作っちゃおうかな。
まずはイケてる魔王とか作っちゃうか。
と思って画像生成してみたら…

ってなった人が私だけじゃないと信じたいので、この記事を書いてます。

えー、先に私のスキルレベルの話しします。画像生成AIを初めて3日目のド初心者です。AIまわりの知識ゼロです。

そして今回の主役、使ってみた画像生成AIは「DALL·E」という奴です。イーロン・マスク氏が出資して設立したAI研究企業が作った奴です。きっとスゴイに違いない。

このDALL·Eがベータ版を公開しておりまして、現在100万人に順次開放中なんですね。
なので利用してみたい人は今すぐウェイティングリストに名前を連ねて順番待ちしましょう！私は半月ぐらいで使えるようになりました。最近はもっと早いっぽい？

初回月50回無料、以降月15回無料！1回で4枚の画像が作れるよ！
無料分は繰り越せず、追加分は課金（115回15ドルです）という利用体系です。なんでちょこちょこ触る趣味レベルなら無料ってことです。

もし追加にするにせよ、15ドルで115回×4枚画像で計460枚作れると。ということは1枚4円じゃん！実質ほぼ無料じゃん！

ただ触る前は「AIって難しいんでしょ…Pythonとか使うんだったら、私は1行もわからんぞ」と恐れていました。
ですがいざDALL·Eを使ってみると、使い方は驚くほど簡単でした。
入力フィールドに文字を書くだけ。
すごーい便利。

簡単なんですけど、出来上がったビジュアルが…
「あれ、思ってたんと違う」となりました。

**最初に作ったティラノサウルスとお化けが戦うホラー映画のポスター。絶対に思ってたのと違う。**

何度か文言を替えてみるが全然上手くいかず。
こんなんじゃタイムライン賑わわないよ！！
同じ画像生成AIなのに何でだ…
私もこんなん作りたいんや。

"Sandy's house steampunk style made with" #dalle #dalle2

If you want to see more or request prompts we have a discord: https://t.co/3lW5KHSKdH pic.twitter.com/HZgnXrc5OZ
— Best Dalle2 Pics (@Dalle2Pics) July 6, 2022

とりあえず先行して情報を吐き出しまくってくれてる深津貴之 (fladdict)氏のnoteやTwitter投稿を読み込んでみることにしました。AIに学習させるレベルの話はさっぱりついていけない…が、この分野は私の領分から離れすぎている。なので画像生成のための文章部分のノウハウ部分を中心に読み込んでいくことにしました。

「パリコレ」って単語いれたら、画質がちょっとあがるな。 pic.twitter.com/rRupcGrFBB
— 深津貴之 / THE GUILD / note.com (@fladdict) July 31, 2022

なるほど、パリコレって生成文にいれると人物の描画品質があがるらしい。

補足すると、「中世」って指定すると普通の中世になっちゃうので、ファンタジー世界にしにくい。
あわせて「ヴィクトリア」「ゴシック」.. https://t.co/b6BzEQsrga

「AIで『中世の都市の俯瞰図』を錬成しようとしているが何度やっても炎を吹き上げ..」https://t.co/VAvs5bUePP にコメントしました。
— 深津貴之 / THE GUILD / note.com (@fladdict) July 28, 2022

なるほど、時代だけじゃなくて「ヴィクトリア」「ゴシック」やら「アールデコ」みたいな形容する表現を生成文に追加するとよりファンタジー表現ができるのか。

という訳で、とにかく大事なのは「生成文の表現」なのだなとおぼろげながら分かってきました。（厳密には上記は別の画像生成AIの話題なんですが、まぁ似たようなもんだろうという雑な理解）
あと画像生成AI系のDiscordでいろんな生成文章を読み解きながら、いろいろ触ってるうちに、ちょっとずつやり方が分かってきました。
それと同時にこの「画像生成文」ってまさに「詠唱文」だなと思うに至りました。上級魔術士たちの詠唱文には素晴らしいスペルが盛りだくさんなんですよ。

というわけで、まず現状を見てもらいましょう。
以下3日目の生成画像群です。

よくなってきたよ！随分マシになった！

という訳で、まだまだ画像生成の実験中ですが、その実験した結果をつらつら書きます。
実験の内容は下記のとおりです。

詠唱文をどうイジったらマシなビジュアルが生成できるか

とりあえず詠唱文の実験として、一番ベーシックな「机の上の人形」を生成してみます。表現装飾はなく下記のように書きました。

a doll on the table

だいぶ普通。
The普通の人形が生成されましたね。
これが詠唱文検証のオリジナルになります。

ではいくつか装飾表現を足して言ってみましょう。最強の詠唱文を目指して。

まずはCG系

まずはCGっぽくしてみます。Unreal EngineやOctane Renderなどフォトリアルに強い単語をぶち込みました。ダメ押しに「photorealistic」もいれときましょう。

a doll on the table, unreal engine, octane render, photorealistic

淡白ながら、それっぽいのができましたね。

次は映画ライティング系

次は質感や陰影を強調してみましょう。
「volumetric lighting」や「cinematic lighting」といった陰影を美しく表現できそうな座標を目指す表現を追加します。

a doll on the table, volumetric lighting, cinematic lighting, moody

まぁちょっと怖いですが、それっぽくなりましたね。

次はダークゲーム系

次はゲームビジュアルっぽい装飾表現を足してみましょう。
混ぜるな危険な感じもしますが。思いつくダーク系で描画がカッコいいタイトルを入れてみます。

a doll on the table, Final Fantasy, DARK SOULS, Bloodborne, ELDEN RING

入力したゲームイメージとはちょっと違うがいい感じだ。
しかし、もとの人形からずいぶん遠くまで来ましたね。

次は大理石彫刻系

今度は素材を変えてみますか。大理石の彫刻にしてみましょう。ディティールを出すのと照明も頑張ってもらいましょう。

a doll on the table, carved white marble, sculpture, 
beautiful highly detailed, cinematic lighting

次はゴシックにデコラティブ系

…ただ、いろいろやりましたが、
なんか全体的に淡白ですね。
次はデコラティブに盛ってみましょう。

a doll on the table, concept art, matte painting, gothic, ornate, 
hyperrealistic, fantasy art, insanely detailed and intricate

おお！　結構盛れましたね。
先人には全然追いつけないですが、少なくとも触ってて楽しい、描画するたびにテンションが上がるビジュアルにはたどり着けました。

最後に盛り盛り系

最後に今回試した詠唱文を全部ぶっこんだらどうなるのかも実験しておきましょう。長いぜ。

a doll on the table, concept art, matte painting, gothic, ornate, 
hyperrealistic, fantasy art, insanely detailed and intricate, 
carved white marble, sculpture, beautiful highly detailed, 
cinematic lighting, Final Fantasy, DARK SOULS, Bloodborne, ELDEN RING, 
volumetric lighting, moody, unreal engine, octane render, photorealistic.

「いでよ！最強の人形！」

…

なんかすっごいトコまで来たね。

という訳で、まだまだ触り始めではありますが、初心者でも「詠唱文」を頑張ると、それっぽいのが作れる、というコトまではたどり着きました。
最初は詠唱文を頑張るという概念すら分かってなかったので大きな進歩ですね！

まぁこの辺のノウハウは一瞬で消え去る気もしてます。しばらくしたらサービス側で回収されそう。
とりあえず今触ってみたいって人のために書いてみました。
未来楽しい〜！！

いいなと思ったら応援しよう！

来世、救われます。