見出し画像

今から始めるAI生成講座(はじめに)

ここ最近、にわかに生成AIが世間を騒がせていますが、なんとなくモヤモヤした感じの人も多いんじゃなかろうか?と思います。
比較的アタマの柔軟な若い層では積極的に試してみたり取り入れる向きも見受けられますが、おじさんカメラマン界隈ではあまり話題になりません。
むしろ嫌悪する意見が目につくくらいです。
わからなくもないんですけどね。

根っからのおっちょこちょいでミーハーなので、AI画像生成については割と早いタイミング(っても3月初旬だけど)で環境を導入してのめり込んだ挙句に別アカまで作る始末です。
まぁ何となく界隈も違うので分けた方が良いかなくらいの軽い気持ちでしたが、今思うと正解でした。
ほぼエロアカと化してますもん(照)
恥ずかしくてモデルさんに合わす顔がありません。
まぁほぼ引退状態なので困ることもあまり無いのですが。

別アカの方はそこそこ盛り上がってるんですが、正直生成に対しては踊り場感はあります。
ネタが尽きたというか。
時間さえあれば生成の呪文(プロンプト)を考えガチャを回しまくってた日々も落ち着きつつあります。

つらつら見てるとモデルさんの方が積極的に試しているような気もします。
なんか乗り遅れたらやべーって焦りはじめた人もいるんじゃなかろうか?
とは言えいまさら人に聞けないしなーとか。
いろいろ指南サイトはあるものの、たくさんありすぎてどれを見たらいいかわからん!なんて御仁もおるんじゃなかろうかと思います。

と言うわけで、カメラマンさんを仲間に引きづり混むべく、導入から生成までの道筋をお伝えしようと思います。
先に書いたように指南サイトは昔に比べてたくさんあるので、詳細はそちらで学んでください(無責任)
ここではもりくまがどうやっているかだけお伝えします。

まぁ相変わらず話が長いので、いくつかに分けます。

とにかく何でもいいから導入したいって方はこちらからどうぞ。

さて、生成AIって言ってもいくつか種類はあります。
ここでは主に画像生成、その中でもStableDiffusionを利用したWebUIの使い方を書いていきます。
てか門外漢なので、詳しいことはわかりません。
Google先生に聞くかChatGPT君に聞いてください。

プログラミングには全く知見が無かったので、そもそもの単語が何を意味してるのか全く分かっていませんが、きっとこんなんだろうなぁって書き方です。
内容に責任を負えませんので、あくまでも自己責任でお願いします。

まずざっくりと概要をば(言葉の説明)

【プログラムについて】

  • StableDiffusion・・・テキストから画像生成する無料で使えるプログラム どこかのサーバー上にあるっぽい。
    似たような物でMidjourneyなんてのもありますが、前者はリアル、後者はイラスト系に強い印象

  • Automatic1111(WebUI)・・・StableDiffusionを利用するためのWebUI(ユーザーインターフェース)
    他にもいろいろありますが、個人的には拡張性も含めてこれが一番だと思います。ちなみにAutomatic1111さんが作ったアプリケーションで、ブラウザ上で動くのでOSに依存しません(ホントはするけど)

【設定関連について】

  • モデル・・・いわゆる我々がイメージする被写体さんではなく、画像生成の肝になるものです。料理で例えるとメニューに近いかもしれません。
    特に東洋系の美少女生成に特化したChiloutMixの登場で、グッと普及が促進されました。
    最近はBRAV5の登場で一気にリアルさが増しました。

  • LoRA・・・簡単に言うと盛り付けです。モデルはあくまで方向性を示しますが、もっとピーキーに、たとえば日本人のアイドル顔に特化したLoRAをかますことで天音あいちゃんみたいな子が出せます。JapaneseDollLikenessとかは有名。

  • VAE・・・簡単に言うと味付けです。下味というか。これもいろいろありますが、個人的には1つあれば十分かなと思ってます。

【サイト関連について】

  • GitHub・・・世界中の研究者がプログラムやコードを保存・公開できるサイト。ここでいろいろ拾ったり引っ張ってきたりします。
    Automatic1111(WebUI)もここにあります。とうぜん英語です。
    詳しく知りたい人はここ読んでください

  • CivitAI・・・ここはカオスです。良い子はあまり近づかない方が良いですが、モデルやLoRAなんかはここから拾うこと多し。

  • Hugging Face・・・ここも良く出てきます。GitHubに近いのではないでしょうか?お世話になってます。ここも英語です。勉強になります。

  • GoogleColab・・・Googleさんが提供しているWeb上で使える機械学習の教育・研究用のツール。Googleアカウントがあれば基本的には無料で使えますが、Automatic1111ユーザーが殺到した為たまらず有料化になった経緯あり。
    画像生成には高速なGPU(グラフィック・プロセッシング・ユニット)が必要なんですが、世界のどこかにある超高速GPUがブラウザ上で利用できる神ツールです。

で、なにがどうなんだよって話ですが
世界のどこかにある(こればっかし)StableDiffusionってプログラムを使うためのWebUIをGoogleColab上で動かして、ChiloutMixを選択してJapaneseDollLikenessなんかを味付けとして使うと、プロンプト次第ではムフフな画像を好きなだけ作ってくれるって訳です。
ね、ハマりそうでしょ?(わかんねーよ)


創るのが好きな妄想系中年。写真、旅、映画