見出し画像

【AI】StableDiffusionで絵を作ろうとしたら前提部分でつまずいて、諦めずに試してみた結果、最後にはなんとかなった話

今回はネット小説のようなタイトルになりました。
自分でもなんとかなるとは思っていなかったので楽しかったです。
参考にした記事の半分程度まで進めることができました。
今度は後半部分も進めたいです。
とりあえず完成品が見たい方は目次から飛んでください。
途中で長くなっている部分は利用規約を要約してもらったりした分なので気にしない人は、自分で参考先の記事を見てもらえれば丁寧に書いてあるので問題ないと思います。
丁寧に解説してくれているのでお勧めです!


はじめに

前回イラストストックという副業に興味をひかれたので高画質の画像や思い通りに画像を生成するために学習をしようと考えた。

その中でも特に参考になる記事を見つけて早速始めようとしたのだが、問題があった。

StableDiffusionの要求スペック

VRAMの容量は最低8GB、できれば12GB以上のものがないと、GPUに負担のかかる高画質な画像生成や複数同時生成が難しくなるとされています。基本的なイラスト生成だけを楽しむならVRAM8GBでも問題ありませんが、後述する「LoRA」などの追加学習を自前で行う場合は、最低12GB以上のグラボが欲しくなってきます。

StableDiffusionに必要なマシンスペック、上記サイトより

うん、え、ハードル高くないですか?

数年前にSteamのゲームにはまっていた頃にSkyrim、Fallout、Witcher、Detroitなどをプレイしたくてグラフィックボードに合わせてパソコンを新調した。
その時から特に不満も無かったのでそのままできたのだけれどそれが下記のスペックだ。

自分の持っているPCのスペック

MB:TUF B350M-PLUS GAMING
CPU:AMD Ryzen5 4500 
メモリ:16GB
主記憶装置:Samsung SSD 860 EVO 1TB
GPU:NVIDIA GeForce RTX 2060 6GB

GPU:NVIDIA GeForce RTX 2060 6GB
半分しかないよ……

しかもPCIのスロットの問題も出てきそうだ。

https://dlcdnets.asus.com/pub/ASUS/mb/SocketAM4/TUF_B350M-PLUS_GAMING/J12949_TUF_B350M-PLUS_GAMING_WEB_20170821.pdf?model=TUF%20B350M-PLUS%20GAMING、公式サイトユーザーマニュアルから、スクリーンショット

おすすめされているグラフィックボード

記事の中でおすすめされているのは2種類。
同様に言及されているちもろぐさんのところでも同じ結果だったので信頼性は非常に高い。

選択肢1:RTX3060(12GB)

1つ目がRTX3060(12GB)、8GBではない点が重要だという。
こちらはコスパに優れながら十分な性能を発揮してくれるとのこと。
ただしこれからの主流となるであろうモデル(この辺もまだ詳しくは理解していない)SDXLなどの新しい世代にはついていけそうにない。
さらに1080pまでは良いとしても4kなどの高解像度を求める場合にはスペックが足りないようだ。

価格.comのデータから大体の価格帯をChatGPTにまとめてもらった。

価格.com2024/10/28検索結果よりChatGPT作成

以下はRTX 3060の価格分布に関する統計結果です:

  • 平均価格:59,534円

  • 標準偏差:15,825円

  • 最安値:39,980円

  • 中央値:59,800円

  • 最頻値付近の範囲(25%点):45,616円

  • 上位25%の価格(75%点):69,013円

  • 最高値:83,999円


  • 最安モデルはPalit RTX 3060 Dualで39,980円。

  • 価格は中央値が約60,000円に集中しており、それ以上の高価格帯も一定数存在。

  • 高価格帯にはMSIやGIGABYTEなどの特別なOC(オーバークロック)モデルが含まれています。

グラフからも、45,000円~60,000円の範囲で多くのモデルが販売されていることが確認できました。用途やブランドの違いで、約40,000円から80,000円の幅広い選択肢が提供されています。 ​


この辺りは元記事でも触れられていたが5万円以下というのが大体の妥当な価格のようだ。

ただしこの先のことを考えると陳腐化する可能性が高い。
いつまで使えるのか、この先の進化はどうなのか。


選択肢2:RTX4070

2つ目はRTX4070これにForge版と呼ばれるものとこれからの主流となるであろうSDXLの組み合わせがおすすめされている。

こちらも同様にChatGPTにまとめてもらう。

価格.com2024/10/28検索結果よりChatGPT作成

以下はRTX 4070の価格分布に関する統計結果です:

  • 平均価格:98,557円

  • 標準偏差:17,950円

  • 最安値:83,800円

  • 中央値:94,979円

  • 最頻値付近の範囲(25%点):86,980円

  • 上位25%の価格(75%点):101,080円

  • 最高値:157,311円


  • 最安モデルはPalit Dual OCおよびPalit WHITEで83,800円。

  • 多くのモデルが85,000円から100,000円の範囲に集中しています。

  • 特別仕様のモデル(例えば、PNY VERTOやASUS ROG STRIX)は高価格帯(約15万円)に位置しています。

このグラフからもわかるように、RTX 4070の価格帯は幅広く、高性能や特別版のモデルほど価格が上昇する傾向があります。用途や予算に応じて幅広い選択肢が提供されています。もし追加の分析や比較が必要であればお知らせください。 ​


こちらも記事通り10万円前後が妥当な価格帯となるようだ。

いやでも待てよ。
ちもろぐさんのところのベンチマーク比較では時間はかかるものの行けなくはないのではないかという期待がある。

そうだ。
すぐに飛び乗ってしまう私は手品の道具を一式買いどうなったか。
倉庫に眠っているベースはひかれているのか。
思い出せ。うっ……

さらに現在の構成が古いので、RTX4070を購入する場合には電源、マザーボードなど結局一式変えることになりそうだ。そうなると10万円では収まらない。パーツ交換で見ても軽く超えてく。

完成品のおすすめを見ていると20万円前後といったところ。


現実を見る

現状すぐにできる選択肢は2つ
1.今の構成でどうなるかやってみる
2.記事のおすすめに出てきたNovelAIの25ドル無制限プランを使う

5万円、10万円に手を出す前にまずはこの2つをやってみよう。

ベンチマークを見る限り快適ではないけれど動くことは動くようだ。
ということで記事に従ってやってみよう。

現状の構成で挑む

WebUIは「Forge」を選択することにした。
インストールに関する記事は以下を参照した。

githubからダウンロードしようとしたところBitdefenderさんから警告が

例外に追加してダウンロード完了

とはいえ久しぶりに警告が出てきたのでもう少し詳しく見ていこう。

READMEファイルを見る。
Stable Diffusion Web UIパッケージのワンクリックインストールと更新を行ってくれる便利なツールであること。

公式サイトもあるんだね。

久しぶりにVirusTotalでファイルの危険性をチェックしてみよう。
素人にできる対策はこれくらいしかない。

結果は62の検出方法で検査したけど危険性は検出されなかった。

https://www.virustotal.com/gui/file/35a68a18addd011b4da7eeed3d1611efefdfcc7d795685c9ff0e7affb99794c9?nocache=1より、スクリーンショット

ソースコードの圧縮ファイルもスキャンしたが同様。

ここまでにして先へ進もう。

インストール先はSSDがおすすめとのこと2TBはあると良いとのことだが、そんなにはない。仕方が無いのでSteamのゲームを削除しよう。

とりあえずこれだけあれば十分か。

解凍したファイルをスキャンする。
どうやらURLが誤検出の問題だったようだ。

インストール作業

実行ファイルをクリックしてインストール。
Windowsお前もか。

詳細情報をクリックして実行する。

ここまでで大分疲れた。
いい感じとはグラフィックボードの評価もしてくれるということですか。
悪くはないということですね。
なんだか一安心。
そして使用許諾契約書ですか。
先生、先生、出番ですよ!

ライセンス全文は上記のリンクから(公式サイト内のですね)

ChatGPTによる使用許諾契約のまとめ

このソフトウェア使用許諾契約(EULA)について、以下の主要なポイントを解説します。

1. 契約の概要

  • 使用許諾契約(EULA): この契約は、ソフトウェア「Stability Matrix」の利用に関する法的な同意書です。利用者(ライセンシー)は、ソフトウェアのダウンロード、インストール、使用を行うことで、契約に同意したとみなされます。同意しない場合、ソフトウェアを使用することはできません。

2. ライセンスの内容

  • ライセンスの付与: Lykos, LLC は利用者に対して、制限付きで非独占的なライセンスを付与します。これは有償ではなく、限定的かつ取り消し可能なものであり、商業目的または個人的な利用にのみ使用できます。

  • 知的財産権: ソフトウェアの著作権およびその他の知的財産権はすべてLykos, LLCに帰属しています。したがって、利用者には商標、ロゴなどの使用権はありません。

3. 権利と制限

  • インストールと使用: ライセンシーはソフトウェアを共有コンピュータや複数のコンピュータにインストールし、バックアップコピーを作成することができますが、それはあくまで個人の利用の範囲内に限られます。

  • 複製と再配布: ソフトウェアのコピーを複製・再配布することは、ライセンサーの明示的な許可なしに行うことはできません。

  • 禁止行為: ライセンシーは違法行為、データベーススクレイピング、逆コンパイルなどの行為を行うことは禁じられています。

4. サポートと契約解除

  • サポート: Lykos, LLCはソフトウェアのサポートやアップデートの提供について義務を負いません。

  • 契約解除: ライセンスは、利用者が契約に違反した場合、自動的に終了します。また、Lykos, LLCまたは利用者が契約を終了することが可能です。

5. 保証の否認と責任の制限

  • 保証の否認: ソフトウェアは「現状のまま」提供され、明示または黙示の保証は一切ありません。利用者はソフトウェアの使用に関するリスクを全て自己負担で受け入れる必要があります。

  • 責任の制限: Lykos, LLCは、利用者が被ったいかなる損害についても責任を負わないとしています。また、損害賠償請求の際の最大の責任額は、ライセンシーがソフトウェアのために支払った実際の金額までとされています。

6. その他の条項

  • 非譲渡性: この契約に基づく権利は、事前の書面による許可なく第三者に譲渡することはできません。

  • 適用法と管轄裁判所: この契約は米国デラウェア州の法律に基づいて解釈され、訴訟はすべてデラウェア州の裁判所で行われるものとします。

結論

このEULAは、利用者に対して一定の権利を付与しつつ、知的財産権を保護し、ライセンサーの責任を制限するための法的枠組みです。利用者は、契約の制約に従い、正しい範囲でソフトウェアを利用することが求められています。

訴訟が起きた場合の金額をChatGPTに推定してもらう。
交通費、宿泊費、弁護士費用などを込み
総合計939,000〜2,660,000円

無いとは思うけれど違反はしないようにしよう。

インストール先について

Portableバージョンを選択することでUSBメモリなどで持ち運びもできるという。バックアップを取っておいて新PCを買うことがあれば移行も楽にできそうなのでお勧め通りこちらでインストールする。

次はなんだ。情報収集の許諾だろうか。
匿名で開発に関するデータを送信するかどうか、サンプル例としてインストールしたバージョンや日時、選んだタイプポータブルかどうかなどを収集すると書かれている。
サンプル例を提示してくれているのは、かなり丁寧な印象。
ふつうはもっと隠すかそっけないのに。

プライバシーポリシーのリンクがあったので一応見ておこう。
先生、お願いします。

全文は上記のリンクから、以下ChatGPTによるまとめ


この文章は、Lykos, LLCが提供するプライバシーポリシーに関する通知です。この通知は、同社のサービスを利用する際にユーザーの個人情報がどのように収集・利用・共有されるかを説明しており、個人のプライバシーに関する重要な情報を提供しています。

以下に、主な内容をまとめて解説します。

1. プライバシーポリシーの概要

  • プライバシーポリシーの目的: この通知は、ユーザーが自身のプライバシー権利と選択肢を理解し、サービス利用に関する情報収集の方法やその理由を理解できるようにすることを目的としています。

  • 連絡先: 質問や不明点があれば、privacy@lykos.ai で連絡を取ることが推奨されています。

2. 収集する情報の種類

  • 個人情報: Lykosは、ユーザーが自ら提供した個人情報を収集します。これには、名前、メールアドレス、ユーザー名、パスワード、連絡先情報などが含まれます。

  • 自動収集される情報: サービス利用時に自動的に収集される情報(IPアドレス、ブラウザの特性、利用状況データなど)も含まれています。

  • 他のソースからの情報: 公共のデータベースやマーケティングパートナーなどの外部ソースからも情報を得ることがあります。これにより、サービス提供やマーケティングの向上が図られます。

3. 情報の処理目的

  • 情報の利用目的: Lykosは、サービスの提供、アカウントの認証、ユーザーとのコミュニケーション、セキュリティおよび法的要件の遵守のために情報を処理します。ユーザーの同意があれば、他の目的でも処理が行われることがあります。

4. 第三者との情報共有

  • 情報の共有: 特定の状況や第三者(ビジネスの譲渡や法的な状況など)と情報が共有されることがあります。具体的には、サービス提供者や提携企業との共有が含まれます。

5. クッキーと追跡技術

  • 追跡技術の使用: Lykosはクッキーや類似の追跡技術を使用して情報を収集・保存します。これにより、サービスの利便性向上と内部分析が行われます。

6. ソーシャルログイン

  • ソーシャルログインの情報: FacebookやTwitterなどのソーシャルメディアアカウントを使用してLykosのサービスにログインする際、ユーザーのプロファイル情報(名前、メールアドレス、友達リストなど)が収集されることがあります。

7. 国際的なデータの転送

  • 情報の転送: サーバーがアメリカに設置されているため、アメリカ以外の国からサービスにアクセスする場合、情報が国際的に転送されることがあります。その場合、データ保護に関する必要な措置が取られます。

8. データの保持期間

  • 情報の保存: 必要に応じて情報は保持されますが、ビジネス上の正当な理由がなくなった場合は削除または匿名化されます。

9. 情報の保護

  • セキュリティ対策: Lykosは、情報を保護するために技術的および組織的なセキュリティ対策を講じていますが、100%の安全性は保証できないと述べています。

10. 未成年者からの情報収集

  • 未成年者のデータ: 18歳未満の未成年者からの情報収集は意図して行っていません。

11. プライバシー権利

  • ユーザーの権利: 欧州経済地域(EEA)やイギリス、カナダなどの特定の地域では、個人情報へのアクセス、修正、削除などの権利が与えられています。

12. ドントトラック機能の制御

  • DNT信号: ウェブブラウザに含まれる「Do-Not-Track」機能について、現在は標準化されていないため対応していないことが明記されています。

13. アメリカ居住者の権利

  • アメリカ居住者への特定の権利: アメリカの住民には特定のプライバシー権利が付与されています。これには、個人情報の種類の明示、収集方法、および共有に関する情報が含まれています。

14. 更新について

  • ポリシーの更新: 必要に応じてこのプライバシー通知は更新されることがあります。変更があった場合はユーザーに通知されます。

15. 連絡方法

  • 問い合わせ先: 質問やコメントがある場合、指定のメールアドレスまたは住所に連絡することができます。

16. データの閲覧、更新、削除の方法

  • データ管理: 自身の情報に関するアクセス、更新、削除のリクエストは公式サイトを通じて行うことが可能です。

このプライバシーポリシーは、Lykosのサービスを利用するにあたり、ユーザーがどのように自身の個人情報が取り扱われるのかを詳細に理解するために重要です。


協力したい気持ちはあるんだけれどGDPR(General Data Protection Regulation)で守られる欧州や、権利の記載のあるアメリカ居住の人間と比べると日本人の立場弱いというか言及すらされていないのね。

というわけで拒否を選択した。

ユーザーインターフェースの選択

Stable Diffusion WebUI Forge
By Illyasviel

これが使いたかったのでこれ一択。

モデルの選択

SD1.5系が軽いとのことなので早速選びたいところだけれど、これはパッケージのインストール中におすすめが表示されているだけなので後回しで良いとのこと。

あと途中で反射でクリックしてしまったがVisualBasicのインストール許可が出ていたかと思う。

待つこと十数分インストールが完了。

Lanchボタンを押して再び待つ。

ブラウザで画面が開いた。

ひとまず大まかに見ていく。
タブは以下の7個
Txt2img
Img2img
Spaces Extras
PNG Info
Checkpoint Merger
Settings
Extensions

公式サイトによるとマニュアルは無い。
元になったというAUTOMATIC1111氏のStableDiffusionWebUIのマニュアルを参照する。

どんなことができるのか

この辺りも参考になりそうだ。

環境別の最適化について

Lanchする前のオプションで軽量化、最適化する方法。
>4GB video card support (also reports of 2GB working)
という言葉もあるのでやってやれないことはない。
でも快適ではない。
この辺りはゲームと同じなのかな。
オプション削って軽くしたり。


ここからはまた解説サイトに戻って順を追ってやってみよう。

Checkpoint(学習モデル)を選ぶ

読み込んだモデルが上の所に表示され、複数あれば選択可能になるのだと思うが初期状態だと何も無いのでクリックしても何も出ない。

StabilityMatrix本体のModelBrowser画面から学習モデルを選択する。
今回は軽いことが条件なのでSD1.5系というものから探す。

Checkpoint以外にも選べるようだ。
今回はそのままで。

ベースモデルも様々だが今回はSD1.5を選択する。

期間やダウンロード数、高評価、新着などで並び替えが可能になっている。この辺りは他のサイトと同じだ。

Year,HighestRatedのソート

Year,MostDownloadedのソート

Year,Newestのソート

Year,installedのソート

エラーが出た

Year,Favoritesのソート

これは自分のお気に入り機能のようだ

Newestで探して良いなと思ったのがこれだ。

このままインポートしたいところだが解説サイトによるとこの段階でライセンスの確認を行う必要があるという。
どこにも書いていない?

検索時の画面右下に…のドットがあるこれをクリックするとCitvitAIで開くというボタンが出るのでそれをクリックする。
今回の場合は下記のサイトが開く。
https://civitai.com/models/389528

右下の黄色い枠で囲った部分にライセンスが書かれている。
今回の場合は「License: CreativeML Open RAIL-M Addendum」
このリンクをクリックすると下記のサイトが開く。

開かれた画面。
ですよね……

えいごがいっぱいだよ

先生、出番ですよー。

ChatGPTによるCreativeML Open RAIL-Mライセンスの解説

このCreativeML Open RAIL-Mライセンスの内容について解説します。このライセンスは、特にAIモデルの使用と配布に関する規約をまとめたもので、以下のポイントに焦点を当てています。

1. ライセンスの背景

  • 目的: このライセンスは、AIモデル(特に生成的なもの)のオープンで責任ある利用を促進するために作成されています。AI技術が芸術やコンテンツ制作に広く使われる中、その技術の利用が社会に与えるポジティブな影響を促進しつつ、不適切な使用を防止することを目的としています。

  • オープンと責任のバランス: オープンソースの理念を踏襲しながらも、特定の用途での使用を制限することで、倫理的な側面や技術的制約から不適切な利用を防ごうとしています。

2. 著作権および特許の使用権

  • 著作権ライセンス: ライセンス提供者(寄稿者)は、モデルやその付属資料(スクリプトなど)を自由に再利用・配布する権利を付与します。これは「非排他的、無償、世界的に適用される」ライセンスで、再配布も可能です。

  • 特許ライセンス: モデルに関する特許権についても、同様に無償で使用できる権利を提供しています。ただし、この権利は、特許権侵害を主張した場合には無効となります。

3. 使用条件

  • 配布の条件: モデルを第三者に提供する際には、同様の使用制限を含めたライセンスを適用しなければなりません。また、改変した場合は、その旨を明示する必要があります。

  • 使用に関する制限: ライセンスの一部として、「特定の使用禁止」が設けられています。具体的には以下のような制限があります:

    • 法律に違反する目的での使用

    • 未成年を搾取・危害する目的での使用

    • 偽情報の生成や、他人を傷つけるための情報拡散

    • 個人を特定できる情報の生成や拡散

    • 人権や法的権利に悪影響を与える自動化された意思決定への使用

    • 差別的な使用、個人の特徴に基づいた偏見を生む目的での使用

    • 医療に関するアドバイスの提供や診断結果の解釈

    • 法執行や司法に関する予測など(例:犯罪行為の予測)

4. 出力物に関する権利

  • ライセンサーは、ユーザーが生成した出力物に対して権利を主張しませんが、ユーザーは出力物の使用方法に対して責任を負います。また、出力物がライセンスに違反しないものでなければなりません。

5. 免責条項と責任制限

  • 免責条項: ライセンス提供者は、モデルや付属資料について「現状のまま(AS IS)」提供し、商品性や特定目的への適合性に関する保証はありません。

  • 責任制限: ライセンスの使用に関して発生する損害(直接的・間接的を問わず)について、ライセンサーは一切の責任を負いません。

6. 使用禁止項目(添付文書A)

  • ライセンスの最後には、特定の使用を禁止する項目が詳細に列挙されています。例えば、未成年に害を与える目的、差別的な使用、法律に反する利用、個人情報の悪用などが含まれます。

まとめ

CreativeML Open RAIL-Mライセンスは、モデルをオープンかつ責任を持って利用することを奨励しながら、特定の悪用を防ぐための制限を設けています。このライセンスにより、AI技術のポテンシャルを活かしつつも、その社会的影響に対する責任を持って使用されることを期待しています。特に「倫理的な使用」と「オープンな共有」のバランスを取ることを重視している点が特徴です。


なるほど。禁止事項以外は自己責任という感じかな。
商用利用可能かはどうだろうか?


CreativeML Open RAIL-Mライセンスには、商用利用に関する明確な記載があります。主に以下のポイントから商用利用の可能性について言及されています。

商用利用の可能性についてのポイント

  1. 商用利用のライセンス付与

    • ライセンス条項では、モデルおよび付随する資料について「非排他的、無償、世界的に適用される著作権ライセンス」を提供しており、これには「複製、公開、実行、サブライセンス、配布」する権利が含まれます。

    • これにより、商用プロジェクトでモデルを利用することは、基本的に可能であることが読み取れます。ただし、この使用があくまでもライセンス内の条件を満たす範囲に限られます。

  2. 使用に対する制約

    • 商用利用を行う際には、ライセンスにおける使用制限(Attachment Aに記載)を遵守する必要があります。例えば、「違法な活動」「差別的行為」「偽情報の生成」などの禁止事項があり、これらに該当する商用利用は認められません。

    • 使用制限に従う限り、モデルの商用利用は可能であると考えられますが、制約があるため、具体的な使用方法によっては制限を受けることもあります。

  3. 出力物の権利について

    • ライセンス提供者は、ユーザーがモデルを使用して生成した出力物(画像や文章など)に対して権利を主張しません。したがって、ユーザーは生成された出力物を商用に利用することが可能です。

    • ただし、生成物がライセンスで禁止されている使用目的に該当しないことを確認する必要があります。

注意すべき点

  • 責任の所在: 商用利用にあたっては、生成物の使用によって発生する責任はユーザー自身にあります。したがって、商用に利用する際には、使用におけるリスクを十分に理解し、倫理的な範囲で利用することが求められます。

  • ライセンスの継承: モデルやその派生物を再配布する際には、商用であっても同じ使用制限を含めたライセンスを適用しなければならないため、第三者に商用利用させる場合にはこの点に留意が必要です​。

まとめ
CreativeML Open RAIL-Mライセンスにおいては、商用利用自体が禁止されているわけではありませんが、利用する際の条件や制約に従う必要があります。具体的には、使用制限に反しないことや、生成物に関する責任をユーザー自身が負うことが求められています。このため、商用プロジェクトでの利用は可能ですが、ライセンスの条件をよく確認し、適切に対応することが重要です。


なるほど。

StableDiffusionのライセンスでもあるようだ。


生成モデルのインストール

安心したところでインストールしてみよう!
「Import」ボタンをクリックするとDownloadがはじまった。

おう……
まずはCivitAIのサイトログインとAPIが必要なのか。

CivitAIのログインとAPIキーおよび規約について

サインインには以下のアカウント連携もしくはEmailアドレスが利用できる。

今回はGoogleアカウントで登録をしてみよう。

利用規約ですね。先生、どうぞ。

Civitaiの利用規約のまとめ(ChatGPTによる)

1. 利用規約の概要

  • 適用範囲: この利用規約はCivitaiのサービス(ウェブサイト、アプリ、関連サービス)を利用する際に適用されるもので、利用者は規約を受け入れることで法的に拘束されることを承諾します。

  • 利用資格: サービスの利用には18歳以上であることが必要で、過去に利用停止された経験がないことが条件です。

2. アカウントと登録

  • サービスの利用にはアカウント登録が必要で、ユーザーは自身の情報(名前、メールアドレスなど)を正確に提供する義務があります。アカウントの安全性はユーザー自身の責任です。

3. サービスの特徴と利用条件

  • 画像生成とモデル共有: CivitaiはAIモデルやAI生成メディアを作成・共有するプラットフォームです。ユーザーは画像を生成したり、学習済みのモデルを共有することができます。

  • Buzzポイント: プラットフォーム内で使える「Buzz」というポイントがあり、これを利用してサービス内で取引を行うことができます。

4. 支払いに関する条件

  • サービスの一部機能は有料であり、料金は予告なしに変更される可能性があります。ユーザーは支払い前に料金を確認し、承諾する必要があります。

  • コンテンツのマネタイズ: クリエイターは自分のコンテンツを他のユーザーに販売することができ、料金設定はクリエイター自身が決定します。

5. ライセンスとコンテンツの取り扱い

  • 限定的なライセンス: ユーザーは個人的かつ非商用目的でサービスを使用するための限定的なライセンスを付与されます。

  • ユーザーコンテンツ: ユーザーが投稿したコンテンツに関する著作権はユーザーにありますが、Civitaiはコンテンツの保存・表示・公開などの権利を持ちます。また、コンテンツが「公開」に設定されている場合、他のユーザーもそのコンテンツを利用できます。

6. 禁止事項

  • サービスの利用において、法律に反する行為や他のユーザーを誹謗中傷する行為、知的財産権を侵害する行為などが禁止されています。

  • 特に未成年者を含む不適切な内容や、虚偽の情報、暴力的なコンテンツなどは厳しく禁止されており、違反した場合はアカウント停止などの措置が取られます。

7. 著作権と知的財産権の保護

  • Civitaiは第三者の知的財産権を尊重し、これに違反するコンテンツは削除されます。また、ユーザーは他者の知的財産を侵害しないようにしなければなりません。

  • DMCA対応: 著作権侵害の申し立てがあった場合、Civitaiはデジタルミレニアム著作権法(DMCA)に基づき適切に対応します。

8. 免責事項と責任の制限

  • 免責事項: サービスは「現状のまま」提供されており、サービスの中断やエラーなどについてCivitaiは保証しません。

  • 責任制限: Civitaiは、サービスの利用に関連して発生する間接的な損害(利益損失など)について一切の責任を負わないとしています。

9. 紛争解決と仲裁

  • Civitaiの利用に関連する紛争は原則として仲裁で解決することとされています。ユーザーはこれに同意することで、裁判所での訴訟やクラスアクションに参加する権利を放棄します。ただし、少額裁判や知的財産権に関する訴訟など、一部の例外があります。

10. 利用規約の変更と終了

  • Civitaiは、利用規約を予告なしに変更する権利を持ちます。ユーザーが規約変更に同意しない場合、サービスの利用を停止する必要があります。

  • サービスの終了やアカウント削除により、ユーザーは投稿したコンテンツへのアクセス権を失うことになります。

まとめ

Civitaiの利用規約では、AIモデルと生成コンテンツを共有・販売できる環境を提供する一方で、倫理的な利用と知的財産権の保護を強く求めています。利用に際しては、違法行為や不適切なコンテンツの投稿を厳しく禁止し、利用者の責任を重視する方針をとっています。サービス利用に関する支払いや著作権、仲裁条項などに注意し、規約に違反しない範囲で利用することが重要です。


お、18歳未満使用不可なのね。これは知らなかった。
コンテンツのマネタイズ、CivitAIの中でも他のユーザーにコンテンツを売れるのか。興味深い。
「デジタルミレニアム著作権法(DMCA)に基づき適切に対応」ってどんなものなのか。

デジタルミレニアム著作権法(DMCA)
Summary: H.R.2281 — 105th Congress (1997-1998)
https://www.congress.gov/bill/105th-congress/house-bill/2281


DMCA(デジタルミレニアム著作権法)概要(ChatGPTによる)

デジタルミレニアム著作権法(Digital Millennium Copyright Act、略してDMCA)は、1998年にアメリカ合衆国で制定された著作権法です。この法律は、デジタル技術の進展とインターネットの普及に伴う新たな著作権の課題に対応するために策定されました。主な目的は、デジタル著作権の保護を強化し、違法コピーの防止を目指すことです。

DMCAは以下の5つの主要な部分(タイトル)から構成されており、それぞれ異なる著作権保護の側面を規定しています。

DMCAの主な内容

Title I: WIPO条約の実施

この部分では、WIPO(世界知的所有権機関)条約に基づき、国際的な著作権保護を強化することを目的としています。これにより、アメリカ国外で制作された音楽録音や建築物に関する著作物も保護されるようになりました。著作権の保護範囲は、WIPOのパフォーマンスおよび録音条約に加盟する国々に広がります。

Title II: オンライン著作権侵害に対する責任制限

「オンライン著作権侵害責任制限法(Online Copyright Infringement Liability Limitation Act)」として知られるこの部分では、オンラインサービスプロバイダ(OSP)に対するセーフハーバー規定を定めています。この規定により、プロバイダが侵害コンテンツの削除などの適切な対応を行う限り、ユーザーが行った著作権侵害に対する法的責任を免除されます。

これにより、YouTubeやFacebookなどのプラットフォームが、ユーザーによる著作権侵害のリスクから保護されつつ、適切な対応を促進する仕組みが形成されました。また、OSPは侵害を繰り返すユーザーのアカウントを停止する方針を導入する必要があります。

Title III: コンピュータメンテナンスまたは修理に関する著作権例外

「コンピュータメンテナンス競争保証法(Computer Maintenance Competition Assurance Act)」として、コンピュータの修理中に必要なソフトウェアのコピーは著作権侵害と見なされないことが規定されています。ただし、このコピーは修理が完了した後、直ちに破棄されなければなりません。

Title IV: その他の規定

著作権登録の管理や、特許商標庁の職員に関する給与の規定など、著作権制度に関連する多岐にわたる内容が含まれています。また、図書館や教育機関に対して、特定の条件下でのデジタル保存やアーカイブを認める規定も盛り込まれています。

Title V: 特定のオリジナルデザインの保護

「船体デザイン保護法(Vessel Hull Design Protection Act)」として、船体などのオリジナルデザインを保護することを目的としています。この部分では、デザインが市場で魅力的または独自の外観を持つものである限り、そのデザインに対する保護を提供します。

技術的保護手段(DRM)の回避禁止と例外

DMCAでは、著作権で保護されたコンテンツにアクセスするための技術的手段(DRM)を回避する行為を禁止しています。これには、コピー防止技術を解除する行為や、そのための技術を製造・販売することが含まれます。ただし、以下のような例外が存在します:

  • 図書館、アーカイブ、教育機関:著作物を取得するかどうかを判断するために、正当な理由でアクセスする場合に限り、技術的保護手段を回避することが認められています。

  • 暗号化技術の研究:暗号化技術の脆弱性を研究することを目的とする場合、技術的手段の回避が一定条件下で許可されています。

DMCAに対する評価

賛成の視点

  • 著作権保護の強化:DMCAは、デジタル環境で著作権が不正に使用されることを防ぎ、著作権者の権利を守る手段として機能しています。

  • セーフハーバー規定による利便性:セーフハーバーの仕組みにより、OSPがユーザーコンテンツを管理しやすくなり、インターネットサービスが健全に成長することを促進しています。

反対の視点

  • フェアユースの制限:DMCAの技術的保護手段回避禁止の規定は、フェアユース(例:教育、批評、研究目的での正当な利用)の権利を阻害する可能性があります。これにより、クリエイターや教育者の活動が制約されることがあり、特に誤った削除が行われるケースも問題です。

  • 誤った削除のリスク:削除通知の仕組みは、権利者が誤った削除要請を行うリスクがあり、その結果合法的なコンテンツが削除されることがあります。このような状況は、著作権法の悪用の一例として指摘されています。

まとめ

DMCAは、デジタル時代における著作権保護を強化する重要な法律であり、特にインターネットの普及に伴う著作権侵害の問題に対応するために必要不可欠です。しかしながら、その一方でフェアユースの制約や、セーフハーバー規定の悪用防止といった課題が残っています。DMCAが今後も著作権保護と自由な表現のバランスを取るためには、法の適用範囲や実際の運用の見直しが求められています。


びっくりするほど進まないな。
OKして進もう。

ユーザー名の入力画面。
表示されるユーザー名はデフォルトではメールアドレスの@より前が入っていたので要注意。多分後から変えられるとは思うけれどメールアドレスに名前とか入ってると危ないので。

ChatGPTによるBuzzの解説

「Buzz」は、このプラットフォーム上で特別な報酬システムとして機能しています。この「Buzz」は、コミュニティでの活動に対して報酬として付与されるもので、クリエイターへの応援や他のユーザーとの交流のために使用できます。主に以下のような方法で獲得や利用が可能です。

Buzzの獲得方法

  1. Bounties(バウンティ): タスクに参加してBuzzを獲得することができます。

  2. Purchase(購入): 直接Buzzを購入することも可能です。

  3. Get Tipped(チップをもらう): 素晴らしいコンテンツを作成することで他のユーザーからBuzzをチップとしてもらうことができます。

  4. Redeem A Code(コードを引き換え): 購入したBuzzカードを引き換えてBuzzを取得することができます。

Buzzの利用方法

「Buzz」を使うことで、さまざまな活動に参加することができます。具体的には以下の通りです:

  1. Train(トレーニング): 自分のLoRA(モデル)を使って画像生成のトレーニングを行うことができます。

  2. Generate Images(画像生成): コミュニティが提供するリソースを使って画像を生成することができます。

  3. Tip An Artist(アーティストにチップ): お気に入りのアーティストを支援するためにBuzzを送ることができます。

  4. Bounties(バウンティ): バウンティを投稿し、Buzzを賞金として提供することで他のユーザーに仕事を依頼できます。

  5. Get Showcased(作品の紹介): Buzzを使用して自分のコンテンツをホームページに掲載してもらうことができます。

  6. Shop Badges And Cosmetics(バッジとコスメの購入): プロフィールを際立たせるためのバッジや装飾アイテムを購入できます。

  7. Shop Merch(グッズの購入): 今後、Buzzでステッカーなどのグッズを購入することができるようになる予定です。

このシステムは、Civitaiコミュニティ内での活動を活性化させ、クリエイターの作品を応援したり、ユーザー同士が交流を深めたりするために設計されています。Buzzを使うことで、自分の好みのクリエイターをサポートするだけでなく、自分自身のスキルアップやプロジェクトへの関与がより楽しくなります。


面白いな。
でも色んなコミュニティがそれぞれ乱立しすぎてもうわけがわからないよ。

とりあえず100Buzzを最初に貰った。
ここでもテキストからイメージが出力できるのか?

サイドバー画像生成についてChatGPTによる解説+α

1. Workflow

  • Workflowセクションでは、「Text-to-image」が選択されています。これは、テキスト入力に基づいて画像を生成するワークフローです。

  • その他にFixモードがある。顔の変更、高画質化ができるようだ。

2. Model

  • Modelには「DreamShaper」というモデルが選択されています。モデル番号として「8」が示されています。ここで使用されているモデルは、特定のAI画像生成に特化したものであり、ユーザーが必要に応じて「Swap(変更)」することも可能です。

3. Additional Resources

  • Additional Resourcesの部分では、リソースを追加することができますが、現在は何も追加されていません。

  • 他のモデルを追加することができるようだ。

4. Prompt

  • Promptという入力欄があり、ここにユーザーが生成したい画像に関するテキストを入力することで、AIがその説明に基づいた画像を生成します。

  • Negative Promptもあります。これは、画像生成の際に避けたい要素を指定するためのものです。

5. Aspect Ratio(アスペクト比)

  • Aspect Ratioのセクションでは、生成される画像の比率を選択することができます。選択肢は以下の3つです:

    • Square(512x512):正方形の画像

    • Landscape(768x512):横長の画像

    • Portrait(512x768):縦長の画像

  • 現在はSquare(正方形)が選択されています。

6. Mature content と Draft Mode

  • Mature contentのトグルスイッチがあり、成人向けコンテンツを生成するかどうかを選択することができます。この例では、オフの状態です。

  • Draft Modeもあり、草案的な状態で生成するかどうかの選択肢ですが、現在はオフになっています。

7. Advanced

  • Advancedのオプション

8. Claim 25 Buzz

  • Claim 25 Buzzと書かれたボタンがあります。これはおそらく利用可能なクレジットやポイントを得るためのものです。

9. Image Generation Terms

  • Image Generation Termsの部分には、利用規約への同意を確認するセクションがあります。この内容を確認し、「I Confirm, Start Generating(確認して生成を開始)」をクリックすることで画像生成プロセスが始まります。

この画面は、AIモデルを使用してユーザーが入力したテキストを基に画像を生成するための各種設定を行うためのものです。ユーザーは生成する画像のスタイルや比率、モデル、追加リソース、プロンプトなどを選択し、生成を開始することができます。

Claimeを押したら25ポイント貰えたようだ。
それを使ってGenerate生成を行う。

生成された一枚がこれだ。
うん、こわいわ。

StableMatrix本体の設定画面のCivitAIの項目にAPIキーを入力することで接続ができるようだ。

イラストで説明までついている

まずはCivitAIのWebサイトを開き、右上のアイコンをクリックして出てきた一覧の下から二番目のアカウントの設定をクリックする。

開いた設定ページの一番下のAPI KeysのところでAddAPIボタンを押す。
適当な半角英数字とかを打ち込む。
なんでもいい例えば「j24oijfpwoihjPP44dWYU」とか適当な文字列を打ち込むとそれを変換してあなただけのキーを作成してくれる。

出来上がった文字列をコピーして最初の接続画面下の所に張り付けてOKを押すと下の画面のようになる。これで完了。


これで一区切り。
面倒だ。
でも頑張ろう。

さっそくもう一度好きなモデルを選んでImportをクリックする。
何も変わらないようで心配になったが、左下のダウンロードマークのボタンをクリックするとしたの画像のように進行状況が表示される。

インストール完了!

再びWebUIをLanchする。

よし!Checkpointに入ってる!
まだ画像一枚も生成していないのにここまでに3時間くらいかかってる気がする。
なぜだ。

はやくいけおじをしゅつりょくしたい。

解説記事に戻ると次はVAEが必要だと書いてある。

VAEのダウンロードと保存について

指示通りのサイトでdownloadボタンをクリックする。
400MBあるので注意。
Checkpointが数GBなので小さいといえば小さいけれど。

ダウンロードしたファイルをStabilityMatrixの解凍したインストール先のData>Models>VAEに入れる。
私の場合はPortableバージョンにしたためかダウンロードフォルダにあった。

Dataフォルダが分からなくなったら設定画面からクリックで開ける。

気を取り直してもう一度Lanchしよう。

クリックしてVAEを選択する。

ついに生成できるのか?
Controlnetの項目は違うようなので飛ばして、それ以外を参考サイトと同じ状態にする。
「DPM++2M Karras」は無かったのでそれに近いものにした。

もういいでしょう。はやく。はやく。

プロンプトどうしようか。

実際の生成

10秒ほどでできたのがこちらです。

うーん思ったのと違うな。
次へいこう。


うん。手書き感はどこへ行ったのか……
何かが間違っている。

あっできた。そうか。

TriggerWordsが必要なのか。
だからプロンプトの中に「in pencil, portrait, sketch」を入れたらできた。
そうかそうか。面白いな。

ファイルサイズは小さい。これを大きいサイズにしていくのか。

高解像度にするために

Hires.fixにチェックを入れてDenoising Strength を0.65に、Upscale by は2で、これも参考サイトと同様の設定。

NGHの導入

CivitAIで「NGH」で検索して出てきたものをダウンロードして「embeddings」フォルダに入れる。これも同様に。

と思ったがそのフォルダが無い。
多分これだな。
「Textuallnversion」、「Place Textual Invesion embeddings here」と書いてあるのでそれっぽい。
やってみよう。

完成品

一枚当たり30秒弱かかるけれど、思っていたよりも全然動く。
ただこれはモデルや設定などが違えばまた違うのかもしれない。

だけれども、なんだか良い。
良いね。
全然使い方は分かってないけれど、とりあえずここまでは来れた。

もう一日が終わる。
今日はここまでにしておこう。


【追記】GPU温度と冷却について
優先設定にしていたからかそこまで上がっていなかった。この辺りも連続して作業するとまた違うのかもしれない。

気に入っていただけたらサポート頂けると嬉しいです。コーヒー代にします。