僕が歩んだ画像生成AIの歴史

AI COLLECTION アドベントカレンダー10日目です。

ども、こんにちは。だだっこぱんだです。
最近高校生じゃなくなってしまいました。

普段はマイクラ鯖運営してたりWebサイトとかアプリとか作ってたりピアノたたいてたりしてます。
今回は、僕が画像生成AIに出会ってからいままでに起きたことをまとめました。

この記事は完全に僕視点の画像生成AIをお届けするものになっています。ちゃんとした年表ではないです。僕に興味を持ってくれた方はぜひご覧ください(?)

MidJourneyに出会う | 2022年 7月

2022年7月12日にMidJourneyが公開されました。

どこでか忘れましたが、夏休みのどっかでなんかの記事を見てMidJourneyに出会いました。この時すでに革命だ!って思いましたね。これ以前に画像生成AIがあることを知らなかったのでめっちゃ興奮しました。

初めて作った画像
prompt: forrest

初めてマイクラを触ったとき並みの感動でした(わかりづらい)
その分、無料アカウントだと制限があると知ったときのがっかり感もデカかったですね。

アニメキャラとかはまだきつい

この頃の画像生成AIはまだ、アニメキャラ画像を作るのはかなり厳しかったです。ちゃんとした人間が出ることそのものがすごいレベルって感じでした。

StableDiffusionの公開 | 2022年 8月

いつものようにZennの技術記事をあさっていたらたまたまこの記事を見つけました。

🤔

🤔🤔

🤔🤔🤔

おーぷんそーすのがぞうせいせいえーあい。。。?

なんかまだパッとしないのでとりあえず使ってみることに
StableDiffusionの公式リポジトリのtxt2img.pyを動かしてみる。。。

🫠

これが、自分のパソコンで動かせる。。。ほんとに信じられないことでしたよ。
この頃のAIを実行するのにはかなりのスペックが必要で、一般人はお金を払ってクラウド上で実行するもの、みたいな認識でした。なので、一気に身近になったのはとても衝撃的でした。

しかしまだアニメ絵は描けない

上のは自分の中で一番頑張ったアニメ絵風の画像です。

プロンプトはこんなんですね👇

concept idea of kawaii anime girl with brown long hair in the evening sky,

ideal face proportions,
beautifully detailed eyes,
brown long hair,
cheerful,
smiling,

light brown clothes,
light brown short skirt,
flying in the sky,

lens flare,
wide angle,
bird's-eye view,

coloful,
digital painting,
thick coating painting,
elaborate illustration,
insane detailed,
dramatic lighting,
masterpiece,
intente beautiful light,
high contrast,

Rembrandt Harmenszoon van Rijn style,
Kyoto Animation, 
Studio Shaft,
Azur Lane,
Vtuber,
pixiv,
8k,
4K,

very high detail,
perfect,

今見るとなんか色々えぐいことしてるなーっていう。。。
ちなみにこの頃は75トークン移行が無視されるということを知らなかったのでめっちゃ長いプロンプトを書いていました。
まだWebUIなんてものもなかったですからね。自分で生成用のコードを書いて生成してって感じでした。

といった感じでアニメ絵を生成するのはやはり難しいようでした。
まあ来年くらいにはこの辺も改善されるかなーとか思いながら進化したMidJourneyで遊ぶ僕👇

2大WebUIの誕生 | 2022年 8月

いま、WebUIと言われるとAUTOMATIC氏のWebUIしか出てこないと思いますが、この頃は2つの大きなWebUIがありました。一つはhlky氏の、もう一つはAUTOMATIC氏のものです。

Hlky氏のWebUI👇(いまは名前が変わっている)


AUTOMATIC1111氏のWebUI👇

自分ははじめHlky氏のWebUIを使っていました。
この頃はまだどっちも機能的には同じレベルでした。
しかしAUTOMATIC1111氏の更新スピードがとんでもなく、すぐに機能が豊富になっていきます。(コードはすごいことになってるけどね)

👇記念すべきファーストコミットでも張っておきます。https://github.com/AUTOMATIC1111/stable-diffusion-webui/tree/71cf18b012857b2cbbc52ff66f63db83689b6bfc


WaifuDiffusion v1.2の公開 | 2022年 9月

毎週レベルでえげつないものが出てくるのはこの時からすでに始まってました。
WaifuDiffusionというモデルが公開されました。
danbooruの画像を使って学習したStablediffusionモデルです。
どうやらアニメ絵が出せるとのことで早速試してみること

🫢

「もっと先だと思っていたものがすぐに出てくる」
今ではこれも当たり前のことになってますがこの頃はただただ衝撃的なことで。。。
僕は東方が好きなのでこれで東方キャラたくさん生成して遊んでました。

NovelAI Diffusionの足音 | 2022年 9月

今ではもう画像生成のアニメモデルの王様と言ってもいいんじゃないでしょうか。NovelAIが画像生成AIに手を出してることを匂わせてきました。
WD1.2で満足してたところに、それをはるかに上回るモデルがっ…!?

NovelAI Diffusionのリリース | 2022年 10月

ついにリリースされました。NovelAI Diffusion。

ある意味ではこれが始まりかもしれません。
python等の技術が必要なく簡単に画像生成を行える。しかもかなりクオリティの高いアニメ絵を。
たくさんの人が興味を持ち、たくさんの人に叩かれましたね;

自分はこの時、「ローカルで動かせないのかぁ」で完全に興味を失っていました。

WD1.2との差

今でもひっかかってます。SD1.4が出てから経った日数は大体同じはず。けれどここまで差が出てるのはすごく不思議です。学習の仕方だけで本当にここまで差が出るのでしょうか。。。?
NovelAIにはまだ何か秘密の技術があったりするのでしょうか?
(どうでもいいけどNAIの画像ってやっぱえっちいよね)

Danbooruで燃える

NovelAIは自らDanbooruを使用して学習したということを公表しました。
そしてこれが大きな反発を呼びます。
かなりいろいろなところで取り上げられてかなり炎上しました。
まあそれでもNovelAIは微動だにしませんでしたが。
ガン無視していくスタイルは割とすきです。

NovelAI Diffusionが流出 | 2022年 10月

今なお続く混沌の始まりです。

※上記Redditの記事はすでに削除されています。

NovelAIがハッキングを受けモデル、ソースコード、その他もろもろが流出したとの情報が入ってきました。
Torrent形式で流されたので一気に拡散(Diffusionだけに🤗)
早速使おうと試みる人々が。。。

そしてWebUIにこんなコミットも。

Hypernetworkはこの時まだ世には出回っておらず、NAIのリークTorrentからのみ確認できるものでした。
それをAUTOMATIC1111氏がWebUIに搭載。
ひゃー;

ここから先の展開はご自分でお調べください。自分もすこし複雑でよくわかってないです。

最後にEmadとAUTOMATIC1111が仲直りしたというのは確か。(話の飛躍)

AI画像コンテストを開催 | 2022年 10月

その節はどうもお世話になりました。
NeroさんとともにAI画像コンテストを開きました。
たくさんの方に参加いただけてとてもうれしかったです。

まあ実はこれスタートダッシュでずっこけたんですけどね。

はい。Neroさんには申し訳ないですが、ぶっちゃけルールがゴミでした。
僕もこの時ちゃんと考えなかったのはほんとによろしくなかった。

そんなこんなでいろいろな方からアドバイスをいただきルールを再調整して開催。
結果めちゃめちゃ応募してもらえて大成功!でした。

👇結果発表でいろいろ説明してるので、もっと知りたい方はこちらを

改めて、AI画像コンテストで様々な方にご迷惑おかけしてしまい大変申し訳ございませんでした。そして参加してくださった方々、支援してくださった方々、応援してくださった方々、本当にありがとうございました。
第2回もやりたいと思っていますのでご期待くださいませ。。。

NijiJourneyリリース | 2022年 11月

MidJourneyのアニメ絵特化版がリリースされました。

ぱっと使ってみた感じかなり強い。

うん

いったいどこから学習したんですか。。。?
ってレベルでいろいろ出てくる。

これはほんとにただの予想にすぎないのですが
NovelAIとかよりもMid, Nijiの方がえぐいところから学習してそう

NijiJourneyは月額課金制なので学生の僕には使えません。おつかれさまでした。

ちゅーん

この時当たりから追加学習とかに興味が出てきた。
とりあえずHypernetworkを学習してみてる僕。


AI画像展 プレ展示会 | 2022年 12月

AI画像展はAI画像コンテストに投稿された画像の上位数作品を展示する会です。
それの予行練習的なものが2022年12月4日に開催されました。

そして、どういうわけかNovelAIのコミュニティマネージャのAiniさんにもお越しいただきました。
英語しゃべれな過ぎてめっちゃ悔しかったのをいまだに忘れられません。

プレなのにもかかわらずたくさんの方に来ていただけました。とても楽しかった!!

AI画像展 開催 | 2022年 12月

本番開催です。横浜市民ギャラリーという場所で行いました。

この日はAiniさんに加えてNovelAIのCTOのChrisさんにもお越しいただきました。
この日もたくさんの方に来ていただきました。僕は受付でキーホルダーを作りまくる機会になってました(?)

AI画像展はこの後さらに1月4日から8日まで続いていましたが、僕は共通テストがあるのでさすがに行けず。。。
ちょいと悔しい

あけおめ


stable-diffusion-webuiが消える | 2023年 1月

新年早々事件です。
みんな大好きAUTOMATIC1111氏のWebUIが突然消えました。

いろいろごたごたしましたが結局その日のうちに復活

原因はこちら👇

Wikiに貼っていたとあるモデル集(?)へのリンクにわいせつ画像がたくさん張られていたのが原因みたいでした。
事前から警告メールは届いていたのかもしれないが、IssueやPRのメールに埋もれていたのかも、とのこと
この規模のリポジトリ管理するのはほんと大変そうですね。。。

TensorRTで高速化 | 2023年 2月

TensorRTという画像生成を高速化する技術があるらしい、というのを聞いてとりあえず使いやすいように実装してみました👇

こういう高速化する系の技術めっちゃ好きなんですよね。限られたリソースでいかに早くするか、みたいな。なんかロマンを感じます。
最近あまり更新できてないですが、受験も終わり時間もできてきたのでまた開発再開するつもりです(たぶん)

Latent Couple | 2023年 2月

この辺からはだいぶ最近のことになるので知ってる人も多くなってきましたかね。
構図が指定できる方法が開発されました。

左に霊夢、右に初音ミク、を指定できます。つよいですよね。

3人も行ける

しかしこれで終わりではなかった

ControlNetの登場 | 2023年 2月

またもや界隈に大きな波が。
ポーズを指定して画像生成ができる方法が出てきました。

これについては少し前に解説記事を出したので良ければ👇

2月は構図の月でしたね。
かなりいろいろ進んだ印象。

最後に

画像生成AIってたのしいですよね。
自分ができなかったジャンルの、作るっていうことができるようになったのはほんとに感動ものです。
これからもたくさん遊んでいきたいと思っています。

それと同時に、これらのAIは今までたくさんの絵を描いてきた絵師の方々によって成り立っているということは忘れてはいけないと思っています。
今にも画像生成AIを抹消したい、何とか法規制をしてほしい、と思う方もいる中でこういうことを言うとバカにしているように聞こえてしまうかもしれませんが、学習元となった絵、そしてそれを描いた方への感謝を忘れてはいけないと思っています。

みんな仲良く画像生成しよう!
おしまい!
(最後の方雑になってしまって申し訳ない)

おまけ

ぼくいまいろいろモデル作ったり開発したりしてるのですが。
もし支援するよっ!って方がいらしたら。
下のfanboxに来ていただけたりするとうれしいです。


いいなと思ったら応援しよう!