画像生成AI StableDiffusionで、手書きイラストを作り変えました。

2023年9月14日 15:14

私は今まで機械学習の勉強をし、環境構築しながらTensorflowやPytorchのチュートリアルを動かして機械学習を学んでいたところ、
昨年の夏、8月の末にはオープンソースの画像生成AI　StableDiffusionの登場。
秋には対話型大規模言語モデルChatGPTが登場し、それに続くようにオープンソースの大規模言語モデルが続々と公開され、
公式ウェブのデモサイト等ではなく、自身のPCのLinuxやWindowsやWSL2上でAIが動作するローカル環境を構築し、改良や更新をしながら、様々な機械学習、AIを動作させて来ました。
その結果、数万枚に及ぶ生成画像と、拡張機能で動画を大量に生成しました。

画像生成AIは公開後たった半年で凄いクオリティに進化しました。
※2023年5月に生成した画像

この経験を活かして「手描きのイラストをAIで作り変える」と言う事に活用してみようと考え、大変恐れ入りますが"にじげん横浜駅前イメージキャラクター”「みそらさん」のイラストをモチーフに画像生成させて頂きました。

但し、人様の描いた絵を勝手にAIで改変すると著作的な問題が発生したり、
描いたイラストレーターの方が不愉快な思いをしたりする事も多々有るため、下記の点に配慮致しました。
①扱うデータセット、画像生成AIの使い方に最大限配慮し、トレースや盗用にはならないように最大限の注意をはらいます。
②image2imageは使わない。※元のイラストや線画をそのまま取り込んで髪の色や背景を変えたりする手法
③また著作権的にクリーンな形でトレーニングされているデータセットを用いる。※商業的なアニメや漫画のキャラクターが簡単に出てくるデータセットは使わない
④元のイラストは、あくまでモチーフとして参考にさせていただく。

まず元のイラストを画像生成AIで作り変える為にどういう手法を取るのか？
まずはControlNetと言う画像の姿勢や構図を継承できる拡張機能のreference_onlyと言うプリプロセッサを使って元の絵をAIに解釈させ似たような画像を生成する手法を取ります。

その結果できた画像はコチラ

特徴は取り込めている様ですが、イラストとして成立せず、大幅に悪化してしまいました…

ここで画像生成AIの別機能。
画像をAIに読み込ませ「画像の特徴を文章化する」工程を行います。
その結果AIが出力した文章を私が微調整し「1girl, blue dress, blue eyes, exquisite background, high detail, earrings, flowers, full body, holding bouquet, holding flowers, brown hair, long dress, long hair, petals, pink rose, red flower, red rose, rose petals, smiling, solo」と言う英語の文章にまとめます。これをPromptと呼び画像生成AIに文章で指示を与えることが出来ます。
※日本語訳すると「1girl, 青いドレス, 青い目, 極上の背景, ハイディテール, イヤリング, 花, 全身, ブーケを持つ, 花を持つ, 茶色の髪, ロングドレス, 長い髪, 花びら, ピンクのバラ, 赤い花, バラの花びら, 微笑む, ソロ」

この文章を元に生成した画像はコチラ