04:使って遊んでみよう！画像生成AI Stable Diffusion

2024年4月7日 19:00

どうも、たまにAIエンジニアのドイです。

今回はAIで遊んでみた回です。
AI活用人材を目指すのなら、やはり興味と好奇心を持って触って遊んで、『知る』のが良いとおもいます。

昨年にSUNABACOさんの8時間耐久モノづくり&LT会
に参加させていただきました。

その中で２つのチャレンジに取り組みました。
①Stable Diffusionの開発環境構築とプロンプトの勉強
②動画編集と応募

②に関しては先日、僕としては成果を出せた

LT会にとどまらず、大企業の公式サイトにか公開してもらうという大きく振りかぶったネタができた。（おじさんには羞恥心などない）
ぜひ見てください。

*******

生成AIの勉強が楽しい。
AI自体の勉強はずっと続けてきたけどそのゴールの一つが生成AIだと言っても良いです。

生成AIは『出力する』系のAIになります。

どんどん遊ぼう。

例えばみなさんが使ってるchatGPTは、
"基本的には"テキスト（文字列）を理解して応答を『生成』するAIです。
（もうマルチモーダルだけど）

今回のStable Diffusionは、テキストからイラストを『生成』するAIです。

動画の生成にもチャレンジ

猫山課長さんをイメージしたイラストを大量に生成

複数のキャラクターを意図的に出すのはすごく難しい。
奇跡の一枚をもとめてプロンプトを操作しながら大量にイラストを出力する他ないのです。

イラストをイメージに近づけるためのプラグインや調整パラメータはたくさんあってまだまだ勉強のしがいがあります。

こちらは矢野さん（）をイメージしたイラスト
キャラ名は『酒カスの矢野さん』です。

いい感じの出来だと思う。

ちびキャラにも挑戦しました。

オジモンシリーズです。
こちらのスジモンがお気に入りです。

ちびキャラにするとなかなかおじさんにならなくて苦労しました。

******

娘の卒業式に寄せて学生風のイラストも生成
これがとんでもなく難しかった。

イラスト系だけでなく、リアルな画像も出力してみるのですが
プロンプトとネガティブプロンプトと駆使しながらしっかりと指示ができないととんでもないキメラができたりします。

Stable Diffusionもかなりの人が使ってて情報も集まりやすくなりました。
それ以外の生成AIもたくさんありますし、プラグインの開発もされています。調整するもの、ズラすもの、動かすもの、さまざまですごいですね。

今後は絵画系や風景が、アイコンや「漫画」などいろいろと挑戦してみたいと思っています。

気をつけなければならないのは使うModelになります。
何を出力するにしても、Modelが学習したデータに著作物を含んでいるとかなりリスキーであることがすでにわかっています。

なので著作権を含まないものでかつ「商用可能」なものとなるとかなりModelが絞られてきます。このModel選びもなかなか楽しいですね。

*******

僕は絵を描くのは好きなんですが、絵師にはなれなかったし、
デジタルイラストにも憧れがあります。
僕が頭の中で思い浮かべたものを出力するのが画像系生成AIだと思っています。なので、言わばプリンターですね。

生成AIをどんな位置付けにするかで利用幅も変わってくると思います。

ググれば利用方法などたくさん出てきます。
プログラミングができなくても、
Pythonが分からなくてもAIは利用できるようになりました。

環境構築するくらいならなんのハードルもないです。
アプリケーションをインストールするように使うことが可能です。
興味があるAIがありましたらどんどん利用することをお勧めします。

【よかったらフォローと、スキ❤️を、そしてX（Twitter）でシェアと感想を頂けると幸いです】

いいなと思ったら応援しよう！

お読みいただきありがとうございました。もし参考になったり面白かったと思っていただけましたらサポートよろしくお願いします。次の執筆のモチベになります。