学習用教師画像収集ソフト imgbrd-grabber
StableDiffusionのlora作成に上記ソフトを利用した画像収集が効率的でした。
入れたはいいものの使い方がよくわからなかったので備忘録代わりに。
(note初めて書くのでかなり雑です)
ダウンロード~インストール~日本語化
以下サイト参照
Danbooruからダウンロードする
画面下のソースボタンを選択するとどのサイトからダウンロードするか選択画面が出てきます。
殆どの人はdanbooruからダウンロードすると思うのでその設定が以下。
danbooru.donmai.usの設定をクリック
ヘッダータブの名前に User-Agent
値に "I used my Danbooru User ID"
と入力
ログインタブはThrough URL(空欄でOK)
設定ができたら確認。
先程の一覧画面からdanbooruにチェックを入れたら完了。
Pixivからダウンロードする
先ほどと同じようにPixivの設定を開く
ログインタブから下記のように設定
Type OAuth2 (PKCE)
Consumer key MOBrBDS8blbauoSck0ZfDbtuzpyT
Consumer secret lsACyCD94FhDUtGTXi3QzcFE2uU1hqtDaKeqrdwj
設定完了後、テストボタンで成功と出ればOK
保存先とダウンロードファイル命名規則
説明が難しいのでとりあえず設定できればいいよって方向けになります。
左下にフォルダーから保存先を指定します。日本語が混じってるとバグるかもしれません。
名前欄ですが、どのような命名規則をするかの設定になります。
%md5%.%ext% とコピペすると検索に引っかかった画像を全てダウンロードします。
Danbooruの重複差分ファイルいらんって方は下記を参照下さい。
私は面倒になったのでやめました。
ダウンロードしてみる
Pixivからちびキャラのイラストをダウンロードしてみます。
ソースからPixivを選択後、検索窓にchibiと入力
沢山引っかかったようです。
事前に左下から保存先を設定し、
右下のすべて取得を選択後、ダウンロードタブを選択し画面遷移します
ダウンロードしたいグループを右クリックし、ダウンロードを押すとダウンロードが始まります。
今回は1041ファイルダウンロードできました。
Danbooruでも要領は同じです。ただDanbooruはゴールドアカウントでないとキーワード(タグ)が2つ以下に制限されます。
3つ以上で検索したい方はGelbooruの利用をおすすめします。
ブラックリスト
ダウンロードしたくないタグをブラックリストに入れることが可能です。
設定→ブラックリストから、1行1タグで設定します。
なお、ダウンロード先のタグと完全一致である必要があります。
とりあえずこれで運用できるレベルかなと思います。
質問はGithubへ!
この記事が気に入ったらサポートをしてみませんか?