見出し画像

Stable Diffusion webUIでcontrol netをやってみよう

この記事は Stable Diffusion WebUIを使用して、ControlNetをやってみたよ!という内容になります。

目標設定

レベル設定は以下
Level1 WebUIを構築できる(ネットで調べてやってみよう)
Level2 WebUIのtext to image で、画像を出してみる

Level3 WebUIのimage to imageで、画像を編集してみる

Level4 WebUIのcontrol netを使用して、画像を作成してみる。(この記事)

使うモデルは以下だけ

使うLoRAはなし。

ここからはControlnetの準備

stable-diffusion-webui-forgeは、Controlnetがビルトインされているので、インストールは不要である。だけどモデルは必要だ。

モデルのダウンロードは以下。
https://github.com/Mikubill/sd-webui-controlnet/wiki/Model-download.
google
 colabでwgetする場合、以下の場所にダウンロードしよう。
/content/stable-diffusion-webui-forge/models/ControlNet

controllnetの画面で、Modelを選択できるようなら成功である。

では、いってみましょう!

少し休憩です

Cannyを使ってみよう

Cannyの基本機能

  • 線画抽出: Cannyを使用すると、元の画像からエッジを抽出し、線画を生成します。これにより、ユーザーは元の画像の構造を保持しつつ、新しいデザインを作成できます 。

  • 自由な色塗り: 抽出した線画を基に、色を自由に変更することが可能です。これにより、アーティストは自分のスタイルに合わせた作品を簡単に作成できます 。

フムフム!

textToImageの画面でも大丈夫だろうか。
元の画像を準備して、線画を抽出してみよう。

元の画像を
ControlNetに入れてみる。

Enableをチェックして、Cannyを選択


Modelもcannyのものを選択するのだ。

これだけでOK。あとは、森の中の緑髪の女の子。という情報だけをプロンプトに入れて、Generateしてみよう。

出ましたね・・・
あとは、Control WeightとControl Modeを変えながら様子を見ましょう

OpenPoseもやるべきでしょう

単純なフリーイラストでは、なかなかポーズ抽出ができなかった。
ので

池谷選手に登場していただいた。
プリプロセッサなどを選ぶ

そして、ハジケマークをクリックすると

ポーズが抽出できたことがわかる。後ろの人もいるな。
厳しいですが、何度か繰り返すことで近いポーズが出ます。

オープンポーズエディターを入れることで、自在に編集できます。

ふー、やれやれ

もっと自由に絵を出すには?

Stable DiffusionのControlNetにおいて、CannyやOpenPose以外にも多くのプリプロセッサが利用されています。これらのプリプロセッサは、画像生成の際に特定の情報を抽出し、生成プロセスを補助する役割を果たします。以下に、よく使われるプリプロセッサを列挙し、それぞれの特徴を説明します。

よく使われるプリプロセッサ一覧

  1. Canny
    概要: 画像のエッジを抽出するためのプリプロセッサ。輪郭を強調し、生成される画像のディテールを向上させます。

  2. Lineart
    概要: 線画を抽出するためのプリプロセッサ。特にアニメスタイルのイラストや線画の生成に適しています。

  3. OpenPose
    概要: 人体のポーズを抽出するためのプリプロセッサ。人物の姿勢や動きを正確に捉え、リアルなポーズを生成するのに役立ちます。

  4. Depth
    概要: 画像の深度情報を抽出するプリプロセッサ。3D感を持たせた画像生成に利用され、奥行きのある表現が可能です。

  5. Segmentation
    概要: 画像を異なるセグメントに分割するプリプロセッサ。オブジェクトの識別や背景の処理に役立ちます。

  6. Normal Map
    概要: 法線マップを生成するプリプロセッサ。表面の凹凸を表現し、リアルな質感を持つ画像生成に寄与します。

  7. Colorization
    概要: モノクロ画像に色を付けるためのプリプロセッサ。特に古い写真やアート作品の復元に利用されます。

  8. Inpaint
    概要: 画像の特定の部分を修正または塗りつぶすためのプリプロセッサ。欠損部分を補完する際に使用され、画像の一貫性を保つのに役立ちます。

  9. Reference
    概要: 参照画像を基にして、生成する画像のスタイルや内容を調整するプリプロセッサ。特定のアートスタイルを模倣する際に有効です。

  10. Scribble
    概要: 手書きのスケッチや落書きを基にしたプリプロセッサ。簡単な線画から詳細な画像を生成するのに役立ちます。

  11. Text
    概要: テキスト情報を基に画像を生成するプリプロセッサ。特定のテーマやコンセプトに基づいた画像を作成する際に使用されます。

  12. Pose
    概要: 人物のポーズを指定するためのプリプロセッサ。OpenPoseと似ていますが、より簡易的なポーズ指定が可能です。

  13. Edge
    概要: 画像のエッジを強調するプリプロセッサ。Cannyと似ていますが、異なるアルゴリズムを使用してエッジを抽出します。

  14. Super Resolution
    概要: 低解像度の画像を高解像度に変換するプリプロセッサ。画像のディテールを向上させ、より鮮明な結果を得ることができます。


うーんなるほど。
お読みいただきありがとうございました。

これにて、レベル4は卒業。

いよいよ、ComfyUIに行ってみよう!

ではまた。

この記事が気に入ったらサポートをしてみませんか?