【11月はやばかった】次のステージに突入してしまった生成AI界隈の動きにみんなついてIKETERUNO？？

SUTO

2023年11月24日 12:23

わたしはついていけてなくて焦っています。
必死でフォローしているのですが、ここ最近の動きは特に異常です。

ちょっとopenAIのゴタゴタに注目している間にいろんなことが起こっていたのをみなさんご存知ですか？
わたしが理解できてる範囲でここ最近起こった出来事を簡単に整理していきますね。

2023年10月6日 LCMが爆誕

正式名称はlatent-consistency-model。
これはリアルタイムで入力したプロンプトが画像に反映されるという魔法みたいな技術。0.5秒で4枚出力しちゃうらしく、通常のStable Diffusionの5倍とのこと。

2023年11月9日 LCM-LoRAが爆誕

このLCMがLoRA形式で公開されたことで身近になり、AI術師の皆さんが次々と試していき一大ムーブメントに。

それにより、LCM/LCM-LoRAを活用したツールが次々と登場

このLCMを活用してリアルタイムに書いた落書きを変換していくというのがとにかくすごかったので、わたしもKritaでのリアルタイムお絵描きを試していました。

Kritaと連携できるkrita-ai-diffusion本当にすごい…！！
ざっくり描いているものがリアルタイム変換されるこの感じはたまらなく楽しいです✨#krita #AIart #生成AI pic.twitter.com/GPF8D7zjhu
— SUTO💡 (@st_e_ai) November 19, 2023

noteにもまとめた件ですね。

そんな素晴らしい体験ができるツールを技術者の皆様がどんどんアップデートして、よりすごいものを発表してくださっています！！
（一旦日本の方のポストに限定しています）

画面取り込み式のLCMリアルタイム変換ツール更新しました！https://t.co/xSOVSLw4Es
こんな感じで画面取り込んでLCM適用できます！
Gradioかまして無いぶん他より速そう？ pic.twitter.com/n3exJHUwnW
— 抹茶もなか (@GianMattya) November 20, 2023

誰でも使えるリアルタイムAIお絵かき。
Akumaからリリースします！ pic.twitter.com/VM0TQ6tmUR
— Akuma.ai (@AkumaAI_JP) November 22, 2023

これのコードここにおいておきます。https://t.co/c9DGxgs4dv

が、Comfy の extension を使っている都合上設定がめっちゃ面倒なので簡単に LCM-LoRA 試したい方には強くオススメしません。
これとかで十分よhttps://t.co/BJPKVQbFQb https://t.co/UV0FugUKxx
— まっくす (@minux302) November 19, 2023

こんな感じの落書きをリアルタイムでAI生成するソフト公開しました。
Googleコラボ無料枠からもギリギリ動きますが、ローカル推奨。https://t.co/KAXYLhbpcZ pic.twitter.com/088VmTjcKI
— とりにく (@tori29umai) November 19, 2023

リアルタイムAIお絵描き、実際にやってみたいという方が何人かいたのでgithubにアップロードしました（コア部分しか作っていないので要望多かったら使いやすいものにアプデしていこうと思います）https://t.co/xSOVSLw4Es pic.twitter.com/K0O1EjvKb7
— 抹茶もなか (@GianMattya) November 17, 2023

そんななか、また別ですごいものがリリースされました…

2023年11月17日 Japanese Stable Diffusion XL (JSDXL)

英語版SDXLをベースにした日本語のプロンプトで生成できるモデルをStablelity AI社がここぞとばかりに発表。

もう英語にわざわざ翻訳しなくていいんや！というありがたいモデル。
どんどん便利になっていく世界。すばらしい。
デモも公開されているのでぜひ試してください。

と、日本語で静止画が作れるなんてべんりだな、なんて喜んでたのもつかの間で下記のリリースです。

2023年11月22日 Stable Video Diffusion公開開始

驚きですね。動画生成のためものすごいモデルが公開されちゃいました。

🌟 動画生成のための革新的なAIモデル「Stable Video Diffusion」を公開しました！🎥

🔍 このモデルはStable Diffusionをベースにしており、あらゆるタイプの人々に向けた動画生成の可能性を広げます。技術的な詳細やコードは、GitHubとHugging Faceでご確認いただけます。

🚀… pic.twitter.com/C20POFbkQG
— Stability AI 日本公式 (@StabilityAI_JP) November 21, 2023

これの何がヤバいかというと、動画にしたときの品質です。
いままでも動画生成の技術はありました。
でもなかなか設定が複雑な上に、綺麗に出力するのが本当に難しかった。
そんなところにこのStable Video Diffusionはめちゃくちゃ高画質な動画を出力してくれるというのに加え、Stablelity AI社の理念によりもちろんのことオープンソースです。
たくさんの方がいま試していらっしゃるのでぜひその品質をご覧になってください。

Stable Video Diffusionで動画を10本テスト生成しました。入力は全てSDXLまたはSD2.1(RealismEngine)での生成画像。ほぼデフォルト設定でリテイクは基本なし。生成後にFFmpegで拡大とフレーム補間だけかけてます。
ローカルで試行錯誤なしにこの品質。これから改善も来るだろうし楽しみ。 https://t.co/08dcr98Uas pic.twitter.com/TrgYgd0zFq
— kogu (@koguGameDev) November 23, 2023

AMIDA The Cyborg
Tools used: ComfyUI, Stable Diffusion 1.5, Ether Real Mix model, Pika_Labs, and ElevenLabs
Credit: World4AI | Yoki
Follow our page for the latest AI videos.#AI美女 #aigirls #AIgirl #AI #AIArtwork #Cyborg #CYBER #Robot #VideoViral #Videos #viral #viralvideo pic.twitter.com/KTA5nUuAmH
— aiTree (@aiTreeio) September 13, 2023

Yoo I made a movie, I feel like Steven Spielberg!

Stable Video Diffusion #stablevideo @EMostaque @StabilityAI pic.twitter.com/5LCgp9nLkC
— Boring Always Bored (@0xCarnival) November 23, 2023

もう、映画つくれてしまうのでは…？

ちなみにもうcomfyUIで試すためのcustom nodeが有志によって公開されています。すごい世の中だ…

追記：11/25に公式でサポートされました！

みんなこの「リアルタイム高品質お絵描き生成の戦い」と「高品質ビデオ生成の戦い」についてIKETERUNO??

いやはや、すごいですね。
ちょっと今年ってどうなってんの？だれがコロナ明けこうなるって予測した？

わたしは10月後半にこのような記事を書きました。

そこでこんな風に締めくくっています。

高品質静止画の戦いはわりとてっぺんが近づいてきてるような気がして終わりが近いと思うで、次は多分AIアニメやAI 3DやAIゲームの方向に広がっていくんだろうなと感じてます。
いまから少しでもわたしも視野を広げておこうと思います。

じぶんのnoteから引用

いやいやいや、たしかに一か月前に高品質静止画の戦いはてっぺんが近づいてる～みたいなこと言ってたけど、こんなに早く戦い終わる？？
気が付いたら「リアルタイム高品質お絵描き生成の戦い」と「高品質ビデオ生成の戦い」に入っちゃってました。

進化が早すぎてもう何が何だかですが、だからこそ情報を追うことをあきらめないようにしたいと思います。
がんばろう、みんな…！！