見出し画像

日刊 画像生成AI (2022年9月26日)

画像生成AI界は、今認識できないスピードで進化をし続けています。
DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開されて..進化の速度が上がり続けており、日々異常なスピードで変化しています。

"取り扱い注意"

そんな中、毎日時間なくて全然情報追えない..!って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。


諸事情で投稿が少し遅れています。ごめんなさい。
なんとか戻します。


昨日までの投稿はこちら


開発


Stable Diffusion 1.5v公開間近(?)

以前2022/9/25に1.5vを公開することを示唆する投稿があったため待機しておりましたが、1.4vのとき同様少し遅れている様子です。(ちなみにWaifu Diffusionの次のバージョンも公開が遅れています)

Emadさんが返信くれました。
推しからメッセージがきたような喜びを感じました。


NovelAIが次々開発経過を発信。

25日の方でも紹介していましたが、ひたすら投稿が続いているため連続でご紹介。これは要注目です。Waifu Diffusion、Trinartよりはるかに綺麗なアニメ絵描画ができるStable Diffusionの微調整モデルをNovelAIというサービスをされている組織が開発中です。

タグ付けすれば、体的なデザインのアイデアを維持しながら、キャラクターの外観を簡単に変更できるそうです。DreamBoothクオリティで色んなキャラクターができてしまうのすごいですね..Stable Diffusion 1.4v単体だと全然ここまで行かないのでただただすごいです。


getimg.aiがDALL・E2に似たOutpainting(StableDiffusion)を開発中(Waitlist登録あります。)

https://www.reddit.com/r/StableDiffusion/comments/xogg2u/progress_on_getimgai_outpainting_prototype_and/

WebUI(by AUTOMATIC1111)の現状搭載の2種類のOutpaintingだとDALLE・2のOutpaintingのような自由度はありませんが、同じレベルで利用できるサービスをgetimg.aiが追加するとのこと。これは便利すぎる。1週間ほどでベータ版が公開できそうとのこと。また他にもアップデートはあるようで以下に記載。

getimg.aiアップデート内容
・一度に最大 4 つの画像を生成できるようになりました
・キーボード ショートカットと生成タイマーを追加
・よくある質問を書きました - UIを少し更新しました
・書き換えられたバックエンド – V100 GPU を備えた自分のクラスターで実行されるようになりました
・すべての NSFW フィルターを無効にしました

Waitlist登録はこちらから、上のメニューのoutpaintingへ飛んで下さい。


ローカルと接続して動くStableDiffusionが使えるDiscordbotが開発。


4900x800画像を1stepで、生のStable Diffusionで生成する。しかも512x512以上のメモリを必要としない!?

すごい、どういうこと..。fourier-shaped noise out-painting for latent diffusion models (stable-diffusion)がこれを可能にしているとのこと。g-diffuser-libの機能のようですが、まだ利用できません。もうすぐ利用可能とのことです。また、マルチモダリティ サンプリング機能を使えるようにするとのことで、txt2music、music2imgも数ヶ月で実現するとのこと。

https://www.reddit.com/r/StableDiffusion/comments/xofgek/ultrahigh_resolution_4900x800_generation_in_1/


アニメ顔を認識していい感じ512x512に切り取るスクリプト

Izumi Satoshiさんが顔認識で画像に切り取ってくれるcolabノートブック制作されていました。メモ。


表現


Minecraft Greg Rutkowski風テクスチャパック

MinecraftのテクスチャパックをStableDiffusionで制作した方がいらっしゃいました。おそらく元のテクスチャをimg2imgして、Greg Rutkowski風にしていると思われます。自分の好きなようにゲームのデザインを変えていけるような時代が来そうですね。

prompt:
a 2d texture by greg rutkowski" Steps: 15, Sampler: DDIM, CFG scale: 8, Seed: 2334514109, Size: 512x512, Model hash: 7460a6fa, Denoising strength: 0.38, Mask blur: 4

https://www.reddit.com/r/StableDiffusion/comments/xnst8j/minecraft_texture_pack_but_everything_is_now_by/

ゴッホ風テクスチャもこの方は作られていました。これは楽しい。

prompt:
a 2d texture, by vincent van gogh Steps: 40, Sampler: DDIM, CFG scale: 30, Seed: 2334514109, Size: 512x512, Model hash: 7460a6fa, Denoising strength: 0.5, Mask blur: 4

https://www.reddit.com/r/StableDiffusion/comments/xnst8j/minecraft_texture_pack_but_everything_is_now_by/


AIに自分の個人情報を伝えてみました。

バズっていたのでメモ。これと似ている事例として、友人も自分の名前を入れたら自分ぽい人が出てきて面白かったと話してて、なるほど..と思いました。CLIP内で名前っぽい感じの羅列や、こういうプロフィール文はプロフィール画像と近いんだと思います。


Asura - Night Hunter

Stable Diffusionで生成されたイラストを組み合わせて作られているようです。なかなかクオリティが高く、Redditでも伸びていました。制作者の方が試行錯誤せず、多くの画像を作るほどいいと書かれていて、なるほど..と思いました。

tasty_colorさん
「.. 最終的なアートができるまでに多くのステップがありました。… 試行錯誤しないこと、より多くの画像を作るほど、あなたが心に描いているものを得ることができる可能性が高くなります。」

https://www.reddit.com/r/StableDiffusion/comments/xnvzgi/asura_night_hunter_art_with_sd/


この日のAIアニメーションセレクト

毎日よかったAIアニメーションを紹介するコーナー。この日はこちら。

videoの各レイヤーごとにimg2imgしていて、それが変化していてかっこいい。既にPVなどで複数活用されているのでもう海外では全然新しくなさそうです。

僕もやっているので見てね


研究


Waifu Diffusion で効率的に画像を生成する

Waifu DiffusionというStableDiffusionを改良したアニメ特化モデルについて、詳しく網羅的に記載されています。


StableDiffusion追加学習の記録

Stable Diffusionの情報をかなり高度に追われている方の一人、海行さんがSDの追加学習の記録を公開してくださっています。


あぶぶさんのフォトバッシュワークフロー


思想・ムーブメント


Is This The Death of VFX?

Corrider crewというアメリカの制作スタジオのYouTubeチャンネルでは、DreamBoothが使われています。DreamBoothは、モデルにすでにある知識をすべて台無しにせず、新しい一貫した知識を与えられる方法です。かなり再生数が回っているので多くの人にDreamBoothが知れ渡ったかもしれません。

最初は一人の男性で検証されていましたが、途中からオフィスを回っていろんな人の顔写真をとり、DreamBoothで壮大なファンタジー物語を作られています。

盛り上がってる。
友達でDreamBoothとかやったら楽しそうだなって思いました。
みんなで映像試写会。
これみんなでやるのが楽しいですよね。
水溜りボンドさんか、すしらーめんりく君が最初にやりそう。

もしyoutuberの方だったり、こういうのしたい人いたら声かけてください。
全然手伝います。


AIで生成した画像を使ったデマ投稿

いくつか通報されているようなので投稿転載だと消えそうだったので..、魚拓。
https://twitter.com/kuron_nano/status/1574121450860007424

この日、大きな注目が集まることがありました。台風15号による静岡県の水害についてTwitterでAIで生成された画像でデマを流した方がいらっしゃいました。本人は謝罪し、大した目的はなかったとのことです。

拡大したらAIで生成された画像だと分かりましたが、小さいサイズで画像を見ると意外と分からないもんですね..。ちょっと一部出そうと思っていたnoteを投稿するのが怖くなりました。

28日のAbema Newsに出られてました。びっくり。


852話さんに家凸事件

主にMidjourneyでのAIを使った風景、アニメ絵の検証の投稿で一気に有名になった852話さんに事件が発生。Twitterの文章だけでは正確には汲み取れないと思いますが、凸者の発言曰く自分の創作物がデータセットに含まれているからお怒りになられているという感じですかね。個人的にはStable Diffusionの仕組みは人間がやっていることとかなり近いという理解なので、「データに含まれている」=「盗作」ではないのであまり理解はできませんが..。(そこで起こると人間に「俺の作品見たな!盗作だ!」って言ってる感じがします。)ただ、852話さんがこの怒っている方の名前か、その方の画像が大量に含まれている周辺の言葉をプロンプトで指定しまくっていて、かなりその方が長年築き上げてきたスタイルを奪ってバンバン生成しまくってるんだったら怒る理由は分かりますが、観測している限りそんなことはないと思っているので、僕は852話さんは悪くないと思っています。

なんとかまた元気になってほしいです。
こちらに内容がまとめられています。


未来の物語 — 人工知能がビデオスターを殺す方法


最後に


Twitterに、毎日製作したものや、最新情報、検証を載せたりしています。よかったらフォローしてくれるとうれしいです。

画像生成AIの実験, 最新情報のまとめはこちら


前回の号はこちら


サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます