ContorlNetとライセンス、フォローしておくべきアカウント
どうも!Hi君です!
今回はHIKE Tech note(仮)の投稿3回目。
Stable DiffusionでControlNetをいろいろ試しながらわかったことをお届けします!
動作環境
今回は、以降の動作確認については以下の環境で行いました。
・inahoomen-OMEN-by-HP-Laptop-17-an0xx
・Ubuntu-20.04(5.15.0-60-generic)
・CUDA v11.7(SDの一部ツールが11.6以上推薦になっている)
SD + ControlNetを使ったポーズ指定付きtxt2img画像生成
下の記事などを参考にしながら検証してみます。
Open Pose Editor
・「Open Pose Editor」はSDのExtensionsの一つ。
・Interactiveにポーズを生成でき、またjson形式でファイル保存する事も出来ます。
{
"width": 512,
"height": 512,
"keypoints": [
[
241,
77
],
[
241,
120
],
[
191,
118
],
[
177,
183
],
[
163,
252
],
[
298,
118
],
[
317,
182
],
[
332,
245
],
[
225,
241
],
[
213,
359
],
[
215,
454
],
[
270,
240
],
[
282,
360
],
[
286,
456
],
[
232,
59
],
[
253,
60
],
[
225,
70
],
[
260,
72
]
]
}
ライセンス関連
調べている最中に見つけた関連記事です。
・AI画像「ControlNet」無料公開中のポーズ指定生成!本来の使用料金は年間250万円?「OpenPose」有償配布は料金発生するので要注意
・ Apache-2.0 license, kohya_sさん版のLoRA
・AGPL-3.0 license, 上のリポジトリのコードで学習したLoRAモデルをSD上で読み込むためのスクリプト
・画像生成AI「Stable Diffusion」のLicense要約を和訳して読む
https://note.com/iwaken71/n/n1e78353f5bea
フォローしておくべき方々
note
この方々の記事が色々参考になると思います。
・npakaさん
技術的な事を結構つぶやいている人など
Twitterを見ている中で気づいた事等
小物や手足指など、制御が利きにくい対象は、cannyやsurface normal or depth情報を付与してControlnetに入れている例をちらほら見かけます。
その他
今週は色々わかった気がします。情報整理しないと!
バックエンドの理論面や歴史的経緯が記載されています↓
DiffusionによるText2Imageの系譜と生成画像が動き出すまで
文:Hi君
協力:inaho株式会社