マーダーミステリーやTRPG(CoC)でキャラクター作成におけるAIイラストの進化と使い方について

2023年2月13日 21:01

AIお絵かきの進化が早すぎる！！！！！！！

AIお絵かき（Midjourney）が世の中で話題になってからしばらく経ちますが、世の中のAIお絵かき事情は激変しました。

当時自分が書いた記事は凄まじい勢いで陳腐化しており、上記の記事は既にあまり見る意味はないです（Midjourneyの使い方という意味ではまだ意味はあるかも）

世はまさに大AIお絵かき時代。人間の欲望とは恐ろしいもので、本来AIお絵かきの苦手分野であった萌えイラストの作成について、恐ろしい勢いで発達しており、当時は「苦手分野」だったのが、今では「もっとも得意とする分野」に変わっております。

また、それに伴い、創作におけるAIイラストの利用についてもかなり状況が変わってきておりますので、2023年2月現在の僕のキャラクター作成方法を書いていきたいと思います。

なお、ここから先、専門用語がバンバン出てきますが、逐一説明していたら鬼のような分量になるため、説明は省きます。AIイラストを説明すると鬼のような専門用語の羅列になるのは避けられないため、ついてこれない人は振り落とすスタイルで説明します

何なのか知りたい人は「○○　AIイラスト」のような形でググってください。分からない人は雰囲気だけで読んでください。

※なお、この記事はあくまで自分の知識にもとづいて書いた記事であり、技術のあり方が変わったり、AIイラストをとりまく法制度などによって陳腐化するおそれは多分にあります。また技術的に間違った解釈をしている可能性もありますので、あくまで参考文献の一つとして読んでください。

■環境について

AIイラストの作成環境については、現状ではStable Diffusion AUTMATIC1111をローカル環境に入れるのが最適です。

ただしこれには一定水準以上のPCおよびビデオボード（GeForce 2060以上？）と、Pythonをローカル環境を構築するだけの知識が必要です。色々な場所で導入方法は説明されているため、今まで一度も組んだことがなくとも、根気さえあれば導入可能です。

また、現在ゲーミングPCを使ってるという人は既に条件をクリアしている人も多く、これは明確なアドバンテージとなります。

ちなみに筆者はローカル環境構築のためにGeForce3060（約５万円）を導入しました。PCで最新のゲームが遊べるグラフィックボードを買ったオマケに無料でAIお絵かきソフトがついてくるとしたらそこまで高い買い物でもないかと思います

また、もしイラストAIを本格的に制作作業を行う目的の場合、NovelAIではどの道ランニングコストがかかるので、気合いを入れてStable Diffusionのローカル環境をオススメします。

次点でGoogle Colab、もしくはNovelAIの利用ですが、以下にそれぞれの環境のメリットデメリットを記載します

■Stable Diffusion AUTMATIC1111（ローカル環境）

メリット：一度環境を作ってしまえば動作は楽。最新の技術を逐次導入したりモデルの入れ替え、大量生成等が自由自在に可能で自由度が高い。
デメリット：初期投資費用と初期環境構築にお金と技術が必要。逆に言えばそれさえ乗り越えればデメリットは一切無い。

■Stable Diffusion AUTMATIC1111（Google Colab）

メリット：無料で疑似ローカル環境が再現可能。拡張性も高い
デメリット：起動の度に手間がかかる、VRAMの環境ガチャが発生する。導入にはかなり専門的なIT知識が必要。Googleの気分一つで利用条件が代わる可能性あり。Googleのスペースを利用するため、アップロードした画像が著作権違反だったりセンシティブだったりする場合に何らかの被害にあう可能性あり。

■NovelAI

メリット：WebUIで環境に依存せず、超お手軽にイラストを生成可能
デメリット：月額料金がかかる。超お手軽ではあるが、ローカル環境構築に比べれば自由度は低い。

※これ以外にも、ローカル環境およびWebサービスは数え切れないほど存在しますが、主流なもののみピックアップしました。正直これ以外のサービスを吟味できるほど知識と時間がない…。

簡単にざっくりまとめると、こんな感じになります

ちなみに、これから書く内容はNovelAIでもできなくはないですが、基本的にはローカル環境前提とした作り方になります。

■キャラクターの生成について

この部分については、技術×センス×試行回数のガチャです。
AIイラストの技術やプロンプトは日々進化しており、これといった定石は存在していません。

AIイラストは「Model」×「Sampler」×「Sampling Step」×「画像のタテヨコのサイズ」×「CFG Scale」×「Clip Skip」×「Prompt」×「Seed値の乱数」を変数とした出力結果であり、それぞれの値を少しいじくるだけでも全く違った結果になるため、技術力を磨き、己のセンスを信じて、その上で試行回数を重ねて良い出力結果を得られるまでひたすらがんばりましょう。

その上で、自分は以下の工程を経てキャラクターを作成しています

①txt2imgで自分のイメージに近いキャラクターをガチャ
②im2imgを繰り返してイメージの点数を高めていく
③仕上げ処理を行う

ここまで書いて薄々感じたかもしれませんが、AIイラストは脳内を簡単に出力してくれる魔法の杖ではありません。
正確に言えば、脳内のイラストを55点くらいの出力では簡単に出してくれるのですが、クオリティアップのために80点や90点を目指そうとすると、相応の勉強や努力が求められます。

自分がキャラクターを出力する場合でも、ガチャや作業を含めると、１キャラクターについて「100～200手順」は少なくとも施行します。後述するimg2imgも含めると１キャラクターあたり300手順くらいは行う想定です。

イケメンの男を出力するためにとりあえず100ガチャした結果。
ここから更に選別作業に入る

「とりあえず100ガチャ」みたいなことをする場合に、NovelAIの従量課金制はあまりにも辛すぎるので、ローカル環境を推奨する部分でもあります。

ちなみに僕は以下の設定が好きです

Model:Anything or Counterfeit（気分で使い分ける）
Steps: 20（20以降は体感であまり変わらないイメージ）
Sampler: DPM++ 2S a Karras（DDIMとeularとこれを気分で使い分ける）
CFG scale: 7（7～10を気分で変える）
Size: 512x728（人物を書く時は正方形より縦長長方形が良い気がする）
Clip skip: 2（よくわからんけどおまじない）

■プロンプト（txt2img）

おそらく一番の人が悩むであろうプロンプトですが、ここについては文献がたくさんあるので勉強しましょう。

単純なプロンプト（"基本呪文"と僕は勝手に呼んでいる、例としては"beautiful Girl,School Uniform"）では上手く出力されない、というのはその通りで、本格的にAIイラストを活用したいなら、まずプロンプトに対する"上級魔法"（勝手にそう呼んでる）を覚える必要があります。

勉強材料は色々ありますが、個人的なオススメとして「元素法典」は必読。

こちらを初めて読む方は、おそらく絶句する方が多いのではないかというくらいに、プロンプトの使い方の概念が違います。一例を挙げると、以下のようなプロンプトの使い方をしています。

■通常プロンプト
(ultra-detailed),(best shadow),classic,(cinematic lighting),dynamic angle,(finely detail),(best masterpiece:1.6),(extremely detailed CG unity 8k wallpaper:1.45),extremely detailed illustration,[3d].(((solo))),(((An extremely delicated and beautiful) girl is spreading her (beautiful wings) and ((flying in the sky)))).(((She has an extremely detailed and beautiful cute anime face),extremely detailed body),,long white hair, bare shoulders,floating hair and detailed mouth).The girl is wearing (white hair ribbon) with black edge,(white translucent (silk) hood),white robe with (gold pattern),white boots with black pattern,detailed white stockings.(The background is very detailed),((((There are many castles in the background)))), (The castles are ((on the clouds))),(Clouds surround the base of the castles)),(Many birds fly in the sky),((((There are many gorgeous colorful (hues)) at the top of the planting),and there are some (detailed) feathers falling in the sky.((((((The background is the sky at dawn)))))),(The light of dawn blooms gloriously))).The painting depicts a scene with many well-defined clouds have beautiful light and shadow

■ネガティブプロンプト
(((missing girl))),(((blurry girl))),((small girl)),(got something in mouth),(open mouth),((ugly mouth)),(((raised hand))),(((golden castle))),((((Pleats)))),(((((Wave-like))))),((oversized wings)),(((dress))),((too long and big robe)),(((Plants))),(Blurred Background),(Blurred Wings),(Twisted Wings),((ugly)),((((watermark)))),(((malformed limbs))),(missing limbs),(((poorly drawn face))),(missing legs),two girls,nsfw,,(too many fingers),(poorly drawn hands),(deformed,missing fngers),(mutated hands and fingers),(bad hands),(three legs),mutilated,more than 2 thighs,(unclear eyes),missing legs,extra legs,bad face,multiple breasts,malformed mutated,bad feet,cropped,extra limbs,missing arms,three arms,long neck,(text),missing fingers,jpeg artifacts,missing arms,long neck,((signature)),disfigured,low quality,worst quality,cropped,extra limbs,ugly,(bad anatomy),error,(The lower half of the disappearance)

とんでもない量の呪文をぶちこんでいるのが分かるかと思います。

また、プロンプトについては大量にぶちこめば良いかというとそうではなく、そのキーワードがイラストに与える影響をちゃんと把握してぶちこむ必要があります。

例えば、以下の記事が参考になります。

プロンプトの量と画像の精細度、方向性はある程度正比例する傾向にあるため、自身の求めている画像を出力するためには、まず上級呪文（大量のプロンプト、有意なワード、大量のネガティブプロンプト）を覚えるところから始める必要があります。

■img2imgを利用した補正

txt2imgである程度理想に近いキャラクターの出力ができますが、おそらくそれだけだと頑張っても60点程度なのではないでしょうか（頑張れば80点、90点も可能ですが）

キャラクターを理想形に近づけるためには、img2imgを活用するのが必須となります。以下に、img2imgの活用方法を掲載します

①まずはtxt2imgでキャラクターのおおまかなイメージを作成する

②その画像を直接編集して、細かい部分の補正を行う（小物の追加削除等）
③方向性を決めたイラストで、img2imgでより方向性を深掘りする
　（この際、Denoising strengthは7～8程度が望ましい）
（②と③を繰り返して、良い感じになるまで繰り返す）

④inpaintで細部を修正する

⑤画像編集ソフトおよび切り抜きサービスで最終仕上げ処理を行う

①まずはtxt2imgでキャラクターのおおまかなイメージを作成する

②その画像を直接編集して、細かい部分の補正を行う（小物の追加削除等）
③方向性を決めたイラストで、img2imgでより方向性を深掘りする
　（この際、Denoising strengthは7～8程度が望ましい）
（②と③を繰り返して、良い感じになるまで繰り返す）

④inpaintで細部を修正する

②③の工程を繰り返すと、どんどんイメージに近づいていきますが、どうしても一部分だけが気に入らないなどが出てくると思います。
この時はinpaintを使って一部を修正しましょう。

inpaintを使う場合は、以下の２つの方法が考えられます

・「元イラストに修正を加えてAIが補正を加える場合はoriginal、strengthは気持ち強め（0.8～0.9？）」→明確なイメージがある場合はこちら

・「元イラストを無視してプロンプトを利用して０から描画して欲しい場合はlatent noiseを選択してstrengthを1」→全部をプロンプト任せにする場合はこちら

これらの工程は、徐々に影響箇所が小さくなっていくため
txt2imgで60点のたたき台を作って
img2imgで60点→80点に深掘りして
inpaintで80点→100点を目指して調整
というイメージで作り、点数を高めていく形になります

こうした工程を何度も何度も繰り返して

やっと完成ー！　ですが、まだまだこれで終わりではありません！　仕上げ処理が待っています！

■最終仕上げ処理

txt2img→img2imgを利用した後、仕上げ処理に入ります。
正直、これがあるなしだと出来栄えが大きく変わります。

①イラストソフト(GIMP,CLIP STUDIO)で色味・明度等の最終調整
　（手で加筆修正できるとなおよい）
②背景切り抜きソフトremove bgを利用して切り抜き
②waifu2xを利用してノイズ除去、高精細度化

AIイラストで出力した直後は、色味がちょっとおかしかったり、AIが最適と判断したイラストと人間が美しいと感じる明度が違ったりします。なので、面倒でもかならず一度、全体的な色味の調整は必須です。

また、AIイラストで出力した直後は背景とキャラクターが同化していることが多く、このままでは素材として使いにくいです。そのため、背景からキャラクターを切り抜く作業が必要です。これについてはremove bgというサービスを利用すると手軽にできます。
（この時、img2imgをする途中で、真っ白背景や真っ黒背景にして「"Black Background"などのワードを入れていると、切り抜きの認識ががしやすくなります）

加えて、waifu2xというサービスを使って、高解像度化およびノイズ除去をすると、イラストとしてのクオリティもぐっと上がるのでオススメです。ここまでやってようやく完成！

このサイズだとあまり恩恵は感じられませんが、AIイラスト出力だと解像度が低いのでwaifu2xはノイズ除去とあわせて高解像度化するのにほぼ必須です。特に、マダミスのHOに利用する（A4用紙に印刷する）などの要件があるのであれば、必ず高解像度化は行うようにしましょう。

こんな感じ気持ちを込めてキャラクターをこねこねして、TRPGのキャラクターやマダミスのキャラクターのイメージを作成しております！！
かわいい子が出来たね！！！

※「仕上げ処理」について、もともとイラスト系のスキルを持っている人がいれば、細部のみ手で修正したり、色合いや瞳の書き込みなど、より高品質に仕上げることが出来ると思います。
自分にはそういった知見は無いので諦めました。無念。
あと、切り抜きについてもremove bgに頼りましたが、もっと良い方法があるはず、多分。良い切り抜き方法がある人は教えてください。（adobe expressと切り抜きACは試しましたが、remove bgが一番良いと感じました、canva proの切り抜きが一番性能良いけど高い…photoshopにも高性能な切り抜きツールあるらしいね…）

まとめ

長くなってしまったのでまとめると

GeforceRTX3060相当のビデオボードをPCに導入して、ローカル環境でPhytonが動くようにしてStable Diffusion Autmatic1111を導入、元素法典を元にPromptを勉強して上級呪文を身に着けて、有意なワードやNegative Promptを設定、ModelはAnythingかCounterfeit、Stepsは 20、Samplerは DPM++ 2S a KarrasかDDIMかeular、CFG scaleは7～10、Sizeは512x728、 Clip skipは2で100回くらいガチャを施行。その後はimg2imgでDenoising strength7～8程度でイメージに近づけて、細部はinpaintで「original＋strength0.8～0.9」もしくは「latent noise＋strength1」で実施。出来上がったものはremove bgで切り抜き、その後はGIMPやCLIP STUDIOで明度、コントラスト、色味を修正してwaifu2xで解像度向上およびノイズ除去して完成！！！

うん！！！　とってもわかりやすくまとまりましたね！！（わかりにくい

AIイラストは今もなお進化を遂げている段階なので、正直この記事もすぐに陳腐化するのが見えていて冷や冷やしますが、基本的には情報収集と試行回数の勝負の世界だと思っています。
皆さんもどんどん情報収集して、腕を磨いてみましょう！