プロのインフラエンジニアが、Intel CPUで、Stable DiffusionとWaifu Diffusionを動かしてみた。
【改変(2023/4/1):python環境インストール時にコマンド追加】
画像生成AI、すごいですね。もはや今年最大のホットトピックと言っても過言ではないでしょう。
ですが、ローカルで、しかもGPUよわよわな環境で動かすにはちと、敷居が高い。nvidiaのGPUで10GBもVRAMが必要とか、どんなだよ。みんなつよつよGPU持ってるんだなぁという感じですか。
興味はありありなのですが、ウチのマシンのGPUはGeForce GTX 1650 4GB。とてもじゃないけど、動作しません。泣きそう。でも、そんな私にも救世主がありました。
OpenVINOっていう、Intel CPUの上で使えるAIというかディープラーニングを行うソフトウェアをつかって、Stable Diffusionを動かそうという営みです。コレならGPUよわよわ勢の私でも、Stable Diffusionが動かせるぞ!
★準備
だもんで、Anaconda という、データサイエンスが得意なPythonの実行環境をインストールします。
上記サイトの、
ここ!をクリックして、ダウンロードしてください。今は、Anaconda3-2022.05-Windows-x86_64.exe という、インストールファイルがダウンできました。インストールは全部デフォルトで、Nextしていってください。
Anacondaがインストールができたら、次はStable DiffuionのOpenVINO版をダウンです。
右上の緑ボタンのCodeをクリック→Download ZIP。Downloadしたzipを解凍して完了です。コレで準備完了です!
スタートメニューからAnaconda Prompt (anaconda3) を「管理者権限」で実行してください。
conda create -n py39 python=3.9
conda activate py39
cd (Downloadしたzipを解凍したフォルダ)
pip install -r requirements.txt
コレで準備は完了です。
★Stable Diffusion実行!
そして、demo.pyを実行します。このAnconda Prompt(管理者権限で実行)で
cd (Downloadしたzipを解凍したフォルダ)
python demo.py --prompt "anime key visual, cute, kawaii japanese girl, seifuku"
・・・好きでしょ?カワイイ制服女子。アニメ絵のほうがクリーチャー()が出てきても、心へのダメージが少ないと思います。たぶん。
うーん、まぁ短い呪文にしては、そこそこ見れるのが出てきたのではないでしょうか。
さて、実はココまでは、9月の頭には出来てました。それから延々と呪文の研究を行っていました。しかし、恐ろしいキラーAIが誕生します。そうWaifu Diffusionです。なんとかOpenVINO環境で動かせないか調べつつ。。そして、ソレが出来るようになったため、この記事を書いているわけです。
★Waifu Diffusion実行!
じつは、Waifu Diffusionは、ココまで来てれば簡単なのでした。要は情報に如何にアクセスできるかが勝負。う~ん、現代の縮図です。
同様に、Anaconda Prompt(管理者権限で実行)で、詠唱します。
python demo.py --model ShadowPower/waifu-diffusion.openvino --prompt "anime key visual, cute, kawaii japanese girl, seifuku"
stable_diffusion.openvino は、--model オプションで、モデルを指定できます。コレ自体は知ってはいたのですが、この規格に合うWaifu Diffusionのモデルにアクセスできるようになるのに時間がかかってしまいました。なんか、6日前にはあったようです。チッ
・・・まぁまぁ。ホントにWaifuなのかな??ちょっとこれから、ガリガリやってみようと思います。朝、呪文をセットして、帰ってきてよく出来た絵をピックする生活も悪くないですよ。では、よいDiffusionライフを!
★いろいろじゅもんをえいしょうしてみた。
画風を色々ためせるのも、画像生成AIの良いところなのかもしれない。顔の表現にこだわってみたり、服の表現にこだわってみたり。