見出し画像

画像生成AI「Stable Diffusion」の完全セットアップマニュアル(Mac版)


何ができるようになるの?

普段使っているPCで以下のように美女の画像が作れるようになります。

InstagramとTikTokに完成した作品を公開しています。
こちらにアップしている作品は全て本記事に記載されている手順に沿って作成されたものです。つまり「誰でも」再現できるということです!

URLはこちらです👇

何でこの記事書いたの?

実は画像生成をする方法は以下のサイト(少し怪しげなオジサンの顔画像があるやつ)に全て書いてあるのです!
ただ英語で説明されている&普段からITに触れていないと正直読んでもピンとこない内容かと思います。とは言え実際の設定自体はとても簡単なのです。
ただネットを調べていると「セットアップのサポートします!」という内容で1万円程の価格設定がされているのを見て、「正直これは高すぎる…」と感じてしまいました…
そんなこともあり「いいマニュアルを作って誰もが簡単に画像生成できるようになるべきだ」という気持ち半分、「コンサル料貰うとしてももっと値段抑えるべきだ」という気持ち半分で、本記事を書こうと決意した次第です。

設定の流れ

まずは全体像を抑えておきましょう。
といっても本当にやることはかなりシンプルです。
先ほどの怪しいオジサンのページに全て書いてます。
ちょっと見てみましょう。

1.If Homebrew is not installed, follow the instructions at https://brew.sh to install it. Keep the terminal window open and follow the instructions under "Next steps" to add Homebrew to your PATH.

2.Open a new terminal window and run brew install cmake protobuf rust python@3.10 git wget

3.Clone the web UI repository by running git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui

4.Place Stable Diffusion models/checkpoints you want to use into stable-diffusion-webui/models/Stable-diffusion. If you don't have any, see Downloading Stable Diffusion Models below.

5.cd stable-diffusion-webui and then ./webui.sh to run the web UI. A Python virtual environment will be created and activated using venv and any remaining missing dependencies will be automatically downloaded and installed.

6.To relaunch the web UI process later, run ./webui.sh again. Note that it doesn't auto update the web UI; to update, run git pull before running ./webui.sh.

はい。英語で書かれて「???」の方もいるかと思うので、以下大まかな流れを日本語でも書いておきます。

1. Pythonをインストール
2. Gitをインストール
3. stable-diffusion-webuiをインストール
4. 起動する

という感じです。
よく分からなくても大丈夫です。
早速やっていきましょう

1. Pythonをインストール

まず何でPythonをインストールするのか?と思うかもしれません。
これは「AI = Pythonで動いている」と思ってくれれば大丈夫です。
今回私たちは「画像生成AIで美女を作りたい」という目的があります。なのでそのためには皆さんのPCにPythonを入れてあげる必要があります。
だいぶ細かいこと無視した説明になっちゃってるので、もう少しちゃんとPython知りたいという方は以下でも読むといいかもしれません。

ではPythonをPCに入れていきましょう。
とは言ったものの、MacBookにはデフォルトでPythonが入っています。
以下のコマンドを打ち込んでみて「Python 3.10.6」と返ってくればこれ以降の手順は不要です。

% python3 --version
Python 3.10.6

違うバージョンが返ってきた場合は「Python 3.10.6」を入れてあげる必要があります。
ちょっと下準備も必要ですが順番に進めていけば大丈夫です。

まずは下準備で「brew」を用意します。

以下コマンドを叩いてみてください。
brewが入っていれば以下みたいにバージョンが返ってくるはずですが、恐らく返ってこないと思います。
以下みたいな結果が返ってくる方はPCにbrewが入っているので、これ以降の下準備は不要です。

% brew -v
Homebrew 3.5.9

下準備といっても以下コマンドを実行するだけです。
Homebrewのホームページにも記載されているものそのままです。

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

実行したら再び以下コマンドを実行してください。
今度は以下みたいな状態になるはずです!

% brew -v
Homebrew 3.5.9

これで下準備は完了です。
brew を使って Python 3.10.6 を入れてください。

brew install python@3.10

再び以下コマンドを実行してください。
今度は以下みたいな状態になるはずです!
これでめでたくpythonのインストール完了です。

% python3 --version
Python 3.10.6


2. Gitをインストール

次に Git をインストールします。
Git って何なの?というと「世界中のすごい人たちが公開してくれているプログラムにアクセスするためのツール」と思ってくれて大丈夫です。
今回は「stable-diffusion-webui」という海外の天才集団たちが作ってくれたプログラムを自分のPCにセットアップしたい、という目的があるので Git が必要となります。
これもかなり大雑把な説明になっているのでもう少し知りたい方は以下の本とかを読んでもいいかもしれませんね。

ではPythonをPCに入れていきましょう。
とは言ったものの、MacBookにはデフォルトでPythonが入っています!
pythonと違って特にバージョンもしていないので入っていれば大丈夫です。

% git --version
git version 2.39.2 (Apple Git-143)

というわけでGitの準備は特段不要ですね。
次に進みましょう。

3. stable-diffusion-webuiをインストール

ようやく私たちは stable-diffusion-webui を手にいれる準備ができました。
といってもやることは1つだけ。コマンドプロンプトから以下のコマンドを実行してください。

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui

しばらくして処理が完了すると、以下のように /Users/PC名 の中に「stable-diffusion-webui」がインストールされているはずです。

Finderのユーザの中に「stable-diffusion-webui」がインストールされています

ちゃんと「stable-diffusion-webui」があることを確認できたら、以下のコマンドを順番に打ち込んでいきましょう。

まずはこれ

% cd stable-diffusion-webui 

次にこれ

% ./webui.sh

そうすると色々動き始めます…
しばらくすると以下の文字が途中に入っているので探してください。

Running on local URL:  http://127.0.0.1:7860

これはwebuiの準備ができたからこのURLからアクセスしてね〜という意味です。本来はプロンプトの中で画像生成AI自体は起動しているのですが、普通の人には理解できないし不便です。なので誰にでも視覚的に使いこなせるにしてくれているのが、この webui なのです。

ということで以下URLにアクセスしましょう。
http://127.0.0.1:7860

そうすると以下のようにwebuiが起動します!
空欄が2つと「Gererate」ボタンが見えますね。ここを埋めるだけでもう画像は作れます!


WebUIに入力する「呪文」を考える

WebUIに空欄が2つあると思います。
ざっくりいうと…
上の段が「Positive Prompt」で「作りたい画像を指示する呪文」
下の段が「Negative Prompt」で「避けたい姿形を指示する呪文」
という感じだと思っていてOKです。

これは具体例を交えて説明した方がいいですね。
上の段:「beautiful girl, long hair」(美女、長い髪)
下の段:「missing fingers」(指が無い)

この呪文で「長い髪の美女を作ってください。ただし指が無い状態は避けてね。」という指示になります。
指があるなんて当たり前じゃん…と思っちゃうかもしれませんが、AIには人間が指5本あるという常識は持ち合わせていません。だからちゃんと指示する必要があるということですね。

Generateボタンを押すとこんな感じで「長い髪の美女」が完成します!

ここを「beautiful girl, short hair」(美女、短い髪)にすると…
今度はショートヘアの美女が完成します!

いかがでしょうか?
この呪文を工夫してあげることで自分好みの画像がいくらでも作れてしまうんです。

ここまでで画像は作成すること自体はできますが、「完成度の高い画像」を作るには他にも色々考えることがあります。
質の高い呪文、サンプリングメソッドや、ステップ数、CFGスケールなど…
次の章ではこれらのことについても解説していきます。

セットアップ完了(基本編)

お疲れさまでした!無事にセットアップできましたでしょうか?
少しでも参考になったと思っていただいたらスキボタンを押していただけると今後の励みになります。

またココナラで本記事のサポートを受け付けています!
分からないことがあればこちらからご連絡いただいても結構です。

完成度の高い画像を作成するためのTips(有料)

ここまでの内容で「とりあえず美女は作成できる状態」にはなります。
ただ経験者としては「ここからが本番…」という感覚です。
以降ではInstagramに投稿した中で反響が多かった画像を用いて、具体的な呪文やパラメータ設定について解説していきたいと思います。
👇のような画像が作れるようになります。

モデル

Lora

Positive Prompt

(Best quality, 8k, 32k, Masterpiece, UHD:1.2), Photo of Sexy Japanese woman,  updo hair, bangs, hair between eyes, smiling, looking at viewer, volleyball uniform, indoor stadium, <lora:VolleyballUniform_v20LyCORIS:1>

Negative Prompt

EasyNegative, paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, glans,extra fingers,fewer fingers,strange fingers,bad hand,backlight, (worst quality, low quality:1.4), watermark, logo, bad anatomy,  fat, multiple hands, multiple arms, multiple heads,2 girls,paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, (outdoor:1.6), manboobs,(ugly:1.331), (duplicate:1.331), (morbid:1.21), (mutilated:1.21), (tranny:1.331), mutated hands, (poorly drawn hands:1.331), blurry, (bad anatomy:1.21), (bad proportions:1.331), extra limbs, (disfigured:1.331), (more than 2 nipples:1.331), (missing arms:1.331), (extra legs:1.331), (fused fingers:1.61051), (too many fingers:1.61051), (unclear eyes:1.331), bad hands, missing fingers, extra digit, (futa:1.1), bad body, NG_DeepNegative_V1_75T

ADetailer(顔補正機能)

設定はこんな感じです

いいなと思ったら応援しよう!