僕が歩んだ画像生成AIの歴史

ddPn08

2023年3月19日 18:16

AI COLLECTION アドベントカレンダー10日目です。

ども、こんにちは。だだっこぱんだです。
最近高校生じゃなくなってしまいました。

普段はマイクラ鯖運営してたりWebサイトとかアプリとか作ってたりピアノたたいてたりしてます。
今回は、僕が画像生成AIに出会ってからいままでに起きたことをまとめました。

この記事は完全に僕視点の画像生成AIをお届けするものになっています。ちゃんとした年表ではないです。僕に興味を持ってくれた方はぜひご覧ください（？）

MidJourneyに出会う | 2022年 7月

2022年7月12日にMidJourneyが公開されました。

どこでか忘れましたが、夏休みのどっかでなんかの記事を見てMidJourneyに出会いました。この時すでに革命だ！って思いましたね。これ以前に画像生成AIがあることを知らなかったのでめっちゃ興奮しました。

初めてマイクラを触ったとき並みの感動でした（わかりづらい）
その分、無料アカウントだと制限があると知ったときのがっかり感もデカかったですね。

アニメキャラとかはまだきつい

この頃の画像生成AIはまだ、アニメキャラ画像を作るのはかなり厳しかったです。ちゃんとした人間が出ることそのものがすごいレベルって感じでした。

StableDiffusionの公開 | 2022年 8月

いつものようにZennの技術記事をあさっていたらたまたまこの記事を見つけました。

🤔

🤔🤔

🤔🤔🤔

おーぷんそーすのがぞうせいせいえーあい。。。？

なんかまだパッとしないのでとりあえず使ってみることに
StableDiffusionの公式リポジトリのtxt2img.pyを動かしてみる。。。

stable-diffusionで
わりとかっこいいものできた pic.twitter.com/Oi6tGXoiJZ
— だだっこぱんだ🍞 (@ddPn08) August 24, 2022

🫠

これが、自分のパソコンで動かせる。。。ほんとに信じられないことでしたよ。
この頃のAIを実行するのにはかなりのスペックが必要で、一般人はお金を払ってクラウド上で実行するもの、みたいな認識でした。なので、一気に身近になったのはとても衝撃的でした。

しかしまだアニメ絵は描けない

#stablediffusion pic.twitter.com/Lg7hJDnT7A
— だだっこぱんだ🍞 (@ddPn08) August 27, 2022

上のは自分の中で一番頑張ったアニメ絵風の画像です。

プロンプトはこんなんですね👇

concept idea of kawaii anime girl with brown long hair in the evening sky,

ideal face proportions,
beautifully detailed eyes,
brown long hair,
cheerful,
smiling,

light brown clothes,
light brown short skirt,
flying in the sky,

lens flare,
wide angle,
bird's-eye view,

coloful,
digital painting,
thick coating painting,
elaborate illustration,
insane detailed,
dramatic lighting,
masterpiece,
intente beautiful light,
high contrast,

Rembrandt Harmenszoon van Rijn style,
Kyoto Animation, 
Studio Shaft,
Azur Lane,
Vtuber,
pixiv,
8k,
4K,

very high detail,
perfect,

今見るとなんか色々えぐいことしてるなーっていう。。。
ちなみにこの頃は75トークン移行が無視されるということを知らなかったのでめっちゃ長いプロンプトを書いていました。
まだWebUIなんてものもなかったですからね。自分で生成用のコードを書いて生成してって感じでした。

といった感じでアニメ絵を生成するのはやはり難しいようでした。
まあ来年くらいにはこの辺も改善されるかなーとか思いながら進化したMidJourneyで遊ぶ僕👇

MidJourneyさらに進化してる pic.twitter.com/Eeto35iFb6
— だだっこぱんだ🍞 (@ddPn08) August 23, 2022

2大WebUIの誕生 | 2022年 8月

いま、WebUIと言われるとAUTOMATIC氏のWebUIしか出てこないと思いますが、この頃は2つの大きなWebUIがありました。一つはhlky氏の、もう一つはAUTOMATIC氏のものです。

Hlky氏のWebUI👇(いまは名前が変わっている)

AUTOMATIC1111氏のWebUI👇

自分ははじめHlky氏のWebUIを使っていました。
この頃はまだどっちも機能的には同じレベルでした。
しかしAUTOMATIC1111氏の更新スピードがとんでもなく、すぐに機能が豊富になっていきます。（コードはすごいことになってるけどね）

👇記念すべきファーストコミットでも張っておきます。https://github.com/AUTOMATIC1111/stable-diffusion-webui/tree/71cf18b012857b2cbbc52ff66f63db83689b6bfc

WaifuDiffusion v1.2の公開 | 2022年 9月

毎週レベルでえげつないものが出てくるのはこの時からすでに始まってました。
WaifuDiffusionというモデルが公開されました。
danbooruの画像を使って学習したStablediffusionモデルです。
どうやらアニメ絵が出せるとのことで早速試してみること

#AIArtwork #stablediffusion pic.twitter.com/YBJ5zaOjsb
— だだっこぱんだ🍞 (@ddPn08) September 14, 2022

🫢

「もっと先だと思っていたものがすぐに出てくる」
今ではこれも当たり前のことになってますがこの頃はただただ衝撃的なことで。。。
僕は東方が好きなのでこれで東方キャラたくさん生成して遊んでました。

NovelAI Diffusionの足音 | 2022年 9月

#NovelAI Image Generation Progress Showcase:
When you include tags in your prompts, you may produce more of the same character with greater consistency! pic.twitter.com/QNQghM3YZY
— NovelAI (@novelaiofficial) September 25, 2022

今ではもう画像生成のアニメモデルの王様と言ってもいいんじゃないでしょうか。NovelAIが画像生成AIに手を出してることを匂わせてきました。
WD1.2で満足してたところに、それをはるかに上回るモデルがっ…！？

NovelAI Diffusionのリリース | 2022年 10月

ついにリリースされました。NovelAI Diffusion。

NovelAI's Image Generation, #NovelAIDiffusion is live on https://t.co/UTsnpZKa6W now!

NovelAI Diffusion Anime image generation is uniquely tailored to give you a creative tool to visualize your visions without limitations, allowing you to paint the stories of your imagination. pic.twitter.com/WZEpQ5idgI
— NovelAI (@novelaiofficial) October 3, 2022

ある意味ではこれが始まりかもしれません。
python等の技術が必要なく簡単に画像生成を行える。しかもかなりクオリティの高いアニメ絵を。
たくさんの人が興味を持ち、たくさんの人に叩かれましたね；

自分はこの時、「ローカルで動かせないのかぁ」で完全に興味を失っていました。

WD1.2との差

waifudiffusionも同じdanbooruで学習してるのに
まあまあ差が出てる...？
wd1.3がどうなるか https://t.co/OS4DGKFIUY
— だだっこぱんだ🍞 (@ddPn08) October 3, 2022

今でもひっかかってます。SD1.4が出てから経った日数は大体同じはず。けれどここまで差が出てるのはすごく不思議です。学習の仕方だけで本当にここまで差が出るのでしょうか。。。？
NovelAIにはまだ何か秘密の技術があったりするのでしょうか？
（どうでもいいけどNAIの画像ってやっぱえっちいよね）

Danbooruで燃える

NovelAI Diffusion has been trained on Danbooru tags but has received some additional overhauling in that regard, so it should respond very well to those tags!
— NovelAI (@novelaiofficial) October 3, 2022

NovelAIは自らDanbooruを使用して学習したということを公表しました。
そしてこれが大きな反発を呼びます。
かなりいろいろなところで取り上げられてかなり炎上しました。
まあそれでもNovelAIは微動だにしませんでしたが。
ガン無視していくスタイルは割とすきです。

NovelAI Diffusionが流出 | 2022年 10月

今なお続く混沌の始まりです。

※上記Redditの記事はすでに削除されています。

NovelAIがハッキングを受けモデル、ソースコード、その他もろもろが流出したとの情報が入ってきました。
Torrent形式で流されたので一気に拡散（Diffusionだけに🤗）
早速使おうと試みる人々が。。。

そしてWebUIにこんなコミットも。

Hypernetworkはこの時まだ世には出回っておらず、NAIのリークTorrentからのみ確認できるものでした。
それをAUTOMATIC1111氏がWebUIに搭載。
ひゃー；

ここから先の展開はご自分でお調べください。自分もすこし複雑でよくわかってないです。

最後にEmadとAUTOMATIC1111が仲直りしたというのは確か。（話の飛躍）

AI画像コンテストを開催 | 2022年 10月

その節はどうもお世話になりました。
NeroさんとともにAI画像コンテストを開きました。
たくさんの方に参加いただけてとてもうれしかったです。

過去最大規模のAI画像のコンテスト「#AI画像コンテスト」の第１弾が本日より開催！【11月17日〆切】
・最優秀賞者には賞金3万円、ZONe１ケース（24本）が贈呈。
・上位50作品は「#AI画像展」へ展示されます。
・1日1枚、誰でも簡単に応募可能です、お気軽にご参加ください。https://t.co/jLvE9ag4eQ pic.twitter.com/LtD8uhH877
— AI画像コンテスト実行委員会 (@AI_contest) October 26, 2022

まあ実はこれスタートダッシュでずっこけたんですけどね。

こちらの「AI画像コンテスト」ですが、たくさんの方から様々なご意見をいただきまして、現状のルール等に不備があることを認識いたしました。
大変申し訳ございませんが、一時的に募集を停止させていただきます。
再開日については後日発表させていただきます。 https://t.co/2S7HPYmius
— AI画像コンテスト実行委員会 (@AI_contest) October 22, 2022

はい。Neroさんには申し訳ないですが、ぶっちゃけルールがゴミでした。
僕もこの時ちゃんと考えなかったのはほんとによろしくなかった。

そんなこんなでいろいろな方からアドバイスをいただきルールを再調整して開催。
結果めちゃめちゃ応募してもらえて大成功！でした。

👇結果発表でいろいろ説明してるので、もっと知りたい方はこちらを

🎉結果発表🎉
ついに！#AI画像コンテストの結果発表を行います！
ただ今、21:00 から、YouTube & Discordのステージ上で配信します！
ワールドカップを見ていた方も奮ってご参加下さい！
👇YouTubeライブhttps://t.co/fhRQU9RyoU

👇Discordサーバーhttps://t.co/BdYA8fKmCs
— AI画像コンテスト実行委員会 (@AI_contest) November 27, 2022

改めて、AI画像コンテストで様々な方にご迷惑おかけしてしまい大変申し訳ございませんでした。そして参加してくださった方々、支援してくださった方々、応援してくださった方々、本当にありがとうございました。
第２回もやりたいと思っていますのでご期待くださいませ。。。

NijiJourneyリリース | 2022年 11月

MidJourneyのアニメ絵特化版がリリースされました。

にじじゃーにーエグくないですか？#nijijourney #aiart pic.twitter.com/Hm6NJnstEV
— だだっこぱんだ🍞 (@ddPn08) November 20, 2022

ぱっと使ってみた感じかなり強い。

おいおいこれすごいぞ
ぞいも学習してやがる
ちょっとこわい#nijijourney pic.twitter.com/VMDuQlkTzC
— だだっこぱんだ🍞 (@ddPn08) November 21, 2022

うん

ゆるきゃんもそう
ぜんぶしましましまりん
単語数が増やせばうまくできるかもだけど#nijijourney https://t.co/xxiYfewt52 pic.twitter.com/JTQiqUUeAP
— だだっこぱんだ🍞 (@ddPn08) November 21, 2022

いったいどこから学習したんですか。。。？
ってレベルでいろいろ出てくる。

これはほんとにただの予想にすぎないのですが
~~NovelAIとかよりもMid, Nijiの方がえぐいところから学習してそう~~

NijiJourneyは月額課金制なので学生の僕には使えません。おつかれさまでした。

ちゅーん

ちゅーん pic.twitter.com/j2Jc9fPeJj
— だだっこぱんだ🍞 (@ddPn08) December 17, 2022

この時当たりから追加学習とかに興味が出てきた。
とりあえずHypernetworkを学習してみてる僕。

今日も今日とてhypernetworkを学習させる。
10000ステップまでいきそう
— だだっこぱんだ🍞 (@ddPn08) December 25, 2022

AI画像展プレ展示会 | 2022年 12月

AI画像展はAI画像コンテストに投稿された画像の上位数作品を展示する会です。
それの予行練習的なものが2022年12月4日に開催されました。

本日12時から開場です！
泉区文化センターギャラリーにぜひ！#AI画像展 pic.twitter.com/r3KFm4kQLy
— AI画像コンテスト実行委員会 (@AI_contest) December 4, 2022

そして、どういうわけかNovelAIのコミュニティマネージャのAiniさんにもお越しいただきました。
英語しゃべれな過ぎてめっちゃ悔しかったのをいまだに忘れられません。

The #AI画像展 pre-exhibit has opened! It is so amazing to see people come in, try each of the contest entry prompts and at the end they can get a keychain of their favorite generation! The exhibit playfully teaches you #AIart prompting, such a smart idea from the @AI_contest team https://t.co/Ci8qSR1n3m pic.twitter.com/OHxz8SfDyP
— NovelAI (@novelaiofficial) December 4, 2022

プレなのにもかかわらずたくさんの方に来ていただけました。とても楽しかった！！

AI画像展開催 | 2022年 12月

本番開催です。横浜市民ギャラリーという場所で行いました。

！！！ pic.twitter.com/AcJLjsCzwB
— AI画像コンテスト実行委員会 (@AI_contest) December 28, 2022

この日はAiniさんに加えてNovelAIのCTOのChrisさんにもお越しいただきました。
この日もたくさんの方に来ていただきました。僕は受付でキーホルダーを作りまくる機会になってました（？）

AI画像展はこの後さらに１月４日から８日まで続いていましたが、僕は共通テストがあるのでさすがに行けず。。。
ちょいと悔しい

あけおめ

あけおめ
— だだっこぱんだ🍞 (@ddPn08) December 31, 2022

stable-diffusion-webuiが消える | 2023年 1月

新年早々事件です。
みんな大好きAUTOMATIC1111氏のWebUIが突然消えました。

悲報
みんな大好きstable-diffusion-webuiを作ったAUTOMATIC1111さんがGithubから消されたらしいです。
かなしいね#AIArt #AIイラスト pic.twitter.com/FvzNoQc7R6
— だだっこぱんだ🍞 (@ddPn08) January 5, 2023

いろいろごたごたしましたが結局その日のうちに復活

帰ってきたみたいです。https://t.co/zc5bJCsfrs
— だだっこぱんだ🍞 (@ddPn08) January 5, 2023

原因はこちら👇

朗報
先ほどAUTOMATIC1111氏はGithubに帰還しました。
原因は性的わいせつな画像が張られているページへの直接的なリンクをWikiに貼っていたことだそうです。
原因わかってすっきり#AIArt #AIイラスト https://t.co/SDz3EuQCpd pic.twitter.com/37wV7ldjMy
— だだっこぱんだ🍞 (@ddPn08) January 5, 2023

Wikiに貼っていたとあるモデル集（？）へのリンクにわいせつ画像がたくさん張られていたのが原因みたいでした。
事前から警告メールは届いていたのかもしれないが、IssueやPRのメールに埋もれていたのかも、とのこと
この規模のリポジトリ管理するのはほんと大変そうですね。。。

TensorRTで高速化 | 2023年 2月

TensorRTという画像生成を高速化する技術があるらしい、というのを聞いてとりあえず使いやすいように実装してみました👇

TensorRTの推論高速化を実装したStableDiffusionWebUI
とりあえず公開します。
画像生成がバカ速いWebUIです。

現段階では起動方法はDocker or Linuxで手動インストールのみです。難易度高いですがご了承ください。早いうちにもっと簡単にしたいと思ってます。https://t.co/uPHZAei91v
— だだっこぱんだ🍞 (@ddPn08) February 5, 2023

こういう高速化する系の技術めっちゃ好きなんですよね。限られたリソースでいかに早くするか、みたいな。なんかロマンを感じます。
最近あまり更新できてないですが、受験も終わり時間もできてきたのでまた開発再開するつもりです（たぶん）

Latent Couple | 2023年 2月

この辺からはだいぶ最近のことになるので知ってる人も多くなってきましたかね。
構図が指定できる方法が開発されました。

もう２ショットで混ざることはなくなりそうです#AIArt #AIイラスト pic.twitter.com/BoqovxFV2J
— だだっこぱんだ🍞 (@ddPn08) February 11, 2023

左に霊夢、右に初音ミク、を指定できます。つよいですよね。

３ショットも行けるで https://t.co/YI3i59sQZj pic.twitter.com/DCGipaJaPa
— だだっこぱんだ🍞 (@ddPn08) February 11, 2023

３人も行ける

しかしこれで終わりではなかった

ControlNetの登場 | 2023年 2月

またもや界隈に大きな波が。
ポーズを指定して画像生成ができる方法が出てきました。

ControlNetバカ面白い
ボーン情報から完璧にポーズ指定できる pic.twitter.com/cOP9aZiwVU
— だだっこぱんだ🍞 (@ddPn08) February 13, 2023

これについては少し前に解説記事を出したので良ければ👇

２月は構図の月でしたね。
かなりいろいろ進んだ印象。

最後に

画像生成AIってたのしいですよね。
自分ができなかったジャンルの、作るっていうことができるようになったのはほんとに感動ものです。
これからもたくさん遊んでいきたいと思っています。

それと同時に、これらのAIは今までたくさんの絵を描いてきた絵師の方々によって成り立っているということは忘れてはいけないと思っています。
今にも画像生成AIを抹消したい、何とか法規制をしてほしい、と思う方もいる中でこういうことを言うとバカにしているように聞こえてしまうかもしれませんが、学習元となった絵、そしてそれを描いた方への感謝を忘れてはいけないと思っています。

みんな仲良く画像生成しよう！
おしまい！
（最後の方雑になってしまって申し訳ない）

おまけ

ぼくいまいろいろモデル作ったり開発したりしてるのですが。
もし支援するよっ！って方がいらしたら。
下のfanboxに来ていただけたりするとうれしいです。