VRChatプレイヤーのためのNovel AI "img2img編"

佐藤かえで

2022年10月19日 11:26

前回はNovel AIの課金プランについて解説していきました。

ざっくりとした内容を書くと

画像生成には月額プラン加入＆ポイント消費による都度課金
$10のプランがおすすめ
月額プラン契約時にポイントが少しついてくるが、課金でポイント購入も可能

今回からはより具体的な使い方の説明をしていきたいと思います。
初回ということで、ざっくりどのように使っていくのかを説明したいと思います。

Quick Start

まずは、画像をアップロードします。
とりあえず、正方形に切り取ってからアップロードしてください。

適当に呪文を入れます。girlなど。
一旦画質を下げて生成します。後から高画質にできます。

ここではSmall squareを選択してください。
Number of Imegeはとりあえず1でいいです。

Strengthを0.4、Noiseを0.1にします。
下の方にある、scaleを15にします。
あとはデフォルトでOKです。
これで一旦生成してみましょう。

たぶん全然違うのがきます。

そしたら、どこが違ったのかを確認します。
まず目の色、髪の色、髪型、背景などが違くなってくると思います。
あとは服装など。
ここが違うと思ったところをプロンプトに入れていきます。顔つきや表情のような細かいところはここでは入れません。

まずは眼鏡がついていないので「red glasses」を入れます。

結構良くなったと思います。

ここからは、prompt、strength、noise、scaleを微調整して画像を作っていきます。

promptにはgochuumon_wa_usagi_desu_ka? など作品名を入れるとそれっぽくなります。

girl , red glasses, twintails, gochuumon_wa_usagi_desu_ka? ,

Number of Imegeを増やすと同時に何枚かを生成できます。わたしはいつも同時に2枚生成しています。

そして気に入ったものが出てきやすくなったら、そのを設定のまま、画質を高画質にして実行します。

girl , red glasses, twintails, purple and orange eyes,

これで完成です！

ちょっと細かい説明

ここからは細かいところについて話していきたいと思います。
まずimg2imgで主にいじれるパラメーターは以下のようになっています。

Prompt
- いわゆる呪文です。画像だけでは作れず呪文も必要です。
モデル
- 基本的には、一番上のやつで大丈夫です。
- Curatedは一番高品質なモデルと書かれています。
- Fullは幅広いバリエーションに対応したモデルと書かれています。
- Furryはケモを生成するやつです。海外でよくみるケモコンテンツっぽいやつが出ます。
Undesired Contents
- ドロップダウンメニューの方はLow Quallity + Bad Anatomyでいいと思います。
- 入力欄は、画像生成で入れて欲しくないことを書きます。
  一般的にネガティブプロンプトと言われているものです。
- このネガティブプロンプトが、高品質な画像生成にかなり寄与することがわかってきました。もう少し自分の中でまとまってきたら書きたいと思います。
Add Quality Tag
- オンオフでどうなるのかわからないんですが、
  公式が推奨って言ってるんで、オンでもいいかなと思います。
Image Resolution
- 画像の解像度です、解像度が低いと低コストです。
- アップロードした画像と同じ縦横比にしないと崩れます。
  なお、縦長のPortrait、横長のLandscapeはNomal,Small,Largeで比率が違うので気をつけてください。
Number of Imeges
- 何枚同時に作るかです。コストはリニアに増えます。
Strength
- どのくらい画像に寄せるのかを決めます。値が低いほど画像に近いです。値が低いほど低コストになります。
noise
- 画像にどのくらいノイズを載せるかです。
- noiseはstrengthより小さい値にした方が良いと公式ドキュメントに書かれています。
scale
- スケール・・・よくわかってません・・・・
- 公式ドキュメントには「どのくらいプロンプトに依存させるか」と記述されています。
seed
- シード値です。ノイズを生成するときの基準となる値です。同じシードから作られた画像は、ほぼ同じ画像になります。
Advanced:Sampling
- 初期のK_euler_ancestralで大丈夫だと思います。
- 詳しく読めてないんですが、Qiitaに解説記事がありましたので貼ります。
- https://qiita.com/nishiha/items/77f33bdd9846725c0cf8

最後に

もっと詳しい使い方の説明は後日書きます！
特に、元のStable Diffusionのこととかを結構調べないといけないなと思いました。
元素法典を読み込んでいきたいと思います。
せっかく一番高いプランを契約してしまったので、なんとか使いこなして記事にして行きたいと思います。

ここまで読んでいただきありがとうございました。

追記履歴

2022/10/19
- Image Resolusionに元の画像と同じ比率にしないといけないを追加しました。
- Number of Imegeの最初の設定は1で進めることにしました。※実際このときは１でやってました。
- 「最後に」を追加しました。
2022/10/20
- 最初のところに前回の課金記事のまとめを書きました。
- ちょっと細かい説明についていろいろ追記しました。