
【11月はやばかった】次のステージに突入してしまった生成AI界隈の動きにみんなついてIKETERUNO??
わたしはついていけてなくて焦っています。
必死でフォローしているのですが、ここ最近の動きは特に異常です。
ちょっとopenAIのゴタゴタに注目している間にいろんなことが起こっていたのをみなさんご存知ですか?
わたしが理解できてる範囲でここ最近起こった出来事を簡単に整理していきますね。
2023年10月6日 LCMが爆誕
正式名称はlatent-consistency-model。
これはリアルタイムで入力したプロンプトが画像に反映されるという魔法みたいな技術。0.5秒で4枚出力しちゃうらしく、通常のStable Diffusionの5倍とのこと。
2023年11月9日 LCM-LoRAが爆誕
このLCMがLoRA形式で公開されたことで身近になり、AI術師の皆さんが次々と試していき一大ムーブメントに。
それにより、LCM/LCM-LoRAを活用したツールが次々と登場
このLCMを活用してリアルタイムに書いた落書きを変換していくというのがとにかくすごかったので、わたしもKritaでのリアルタイムお絵描きを試していました。
Kritaと連携できるkrita-ai-diffusion本当にすごい…!!
— SUTO💡 (@st_e_ai) November 19, 2023
ざっくり描いているものがリアルタイム変換されるこの感じはたまらなく楽しいです✨#krita #AIart #生成AI pic.twitter.com/GPF8D7zjhu
noteにもまとめた件ですね。
そんな素晴らしい体験ができるツールを技術者の皆様がどんどんアップデートして、よりすごいものを発表してくださっています!!
(一旦日本の方のポストに限定しています)
画面取り込み式のLCMリアルタイム変換ツール更新しました!https://t.co/xSOVSLw4Es
— 抹茶もなか (@GianMattya) November 20, 2023
こんな感じで画面取り込んでLCM適用できます!
Gradioかまして無いぶん他より速そう? pic.twitter.com/n3exJHUwnW
誰でも使えるリアルタイムAIお絵かき。
— Akuma.ai (@AkumaAI_JP) November 22, 2023
Akumaからリリースします! pic.twitter.com/VM0TQ6tmUR
これのコードここにおいておきます。https://t.co/c9DGxgs4dv
— まっくす (@minux302) November 19, 2023
が、Comfy の extension を使っている都合上設定がめっちゃ面倒なので簡単に LCM-LoRA 試したい方には強くオススメしません。
これとかで十分よhttps://t.co/BJPKVQbFQb https://t.co/UV0FugUKxx
こんな感じの落書きをリアルタイムでAI生成するソフト公開しました。
— とりにく (@tori29umai) November 19, 2023
Googleコラボ無料枠からもギリギリ動きますが、ローカル推奨。https://t.co/KAXYLhbpcZ pic.twitter.com/088VmTjcKI
リアルタイムAIお絵描き、実際にやってみたいという方が何人かいたのでgithubにアップロードしました(コア部分しか作っていないので要望多かったら使いやすいものにアプデしていこうと思います)https://t.co/xSOVSLw4Es pic.twitter.com/K0O1EjvKb7
— 抹茶もなか (@GianMattya) November 17, 2023
そんななか、また別ですごいものがリリースされました…
2023年11月17日 Japanese Stable Diffusion XL (JSDXL)
英語版SDXLをベースにした日本語のプロンプトで生成できるモデルをStablelity AI社がここぞとばかりに発表。
もう英語にわざわざ翻訳しなくていいんや!というありがたいモデル。
どんどん便利になっていく世界。すばらしい。
デモも公開されているのでぜひ試してください。
と、日本語で静止画が作れるなんてべんりだな、なんて喜んでたのもつかの間で下記のリリースです。
2023年11月22日 Stable Video Diffusion公開開始
驚きですね。動画生成のためものすごいモデルが公開されちゃいました。
🌟 動画生成のための革新的なAIモデル「Stable Video Diffusion」を公開しました!🎥
— Stability AI 日本公式 (@StabilityAI_JP) November 21, 2023
🔍 このモデルはStable Diffusionをベースにしており、あらゆるタイプの人々に向けた動画生成の可能性を広げます。技術的な詳細やコードは、GitHubとHugging Faceでご確認いただけます。
🚀… pic.twitter.com/C20POFbkQG
これの何がヤバいかというと、動画にしたときの品質です。
いままでも動画生成の技術はありました。
でもなかなか設定が複雑な上に、綺麗に出力するのが本当に難しかった。
そんなところにこのStable Video Diffusionはめちゃくちゃ高画質な動画を出力してくれるというのに加え、Stablelity AI社の理念によりもちろんのことオープンソースです。
たくさんの方がいま試していらっしゃるのでぜひその品質をご覧になってください。
Stable Video Diffusionで動画を10本テスト生成しました。入力は全てSDXLまたはSD2.1(RealismEngine)での生成画像。ほぼデフォルト設定でリテイクは基本なし。生成後にFFmpegで拡大とフレーム補間だけかけてます。
— kogu (@koguGameDev) November 23, 2023
ローカルで試行錯誤なしにこの品質。これから改善も来るだろうし楽しみ。 https://t.co/08dcr98Uas pic.twitter.com/TrgYgd0zFq
AMIDA The Cyborg
— aiTree (@aiTreeio) September 13, 2023
Tools used: ComfyUI, Stable Diffusion 1.5, Ether Real Mix model, Pika_Labs, and ElevenLabs
Credit: World4AI | Yoki
Follow our page for the latest AI videos.#AI美女 #aigirls #AIgirl #AI #AIArtwork #Cyborg #CYBER #Robot #VideoViral #Videos #viral #viralvideo pic.twitter.com/KTA5nUuAmH
Yoo I made a movie, I feel like Steven Spielberg!
— Boring Always Bored (@0xCarnival) November 23, 2023
Stable Video Diffusion #stablevideo @EMostaque@StabilityAI pic.twitter.com/5LCgp9nLkC
もう、映画つくれてしまうのでは…?
ちなみにもうcomfyUIで試すためのcustom nodeが有志によって公開されています。すごい世の中だ…
追記:11/25に公式でサポートされました!
みんなこの「リアルタイム高品質お絵描き生成の戦い」と「高品質ビデオ生成の戦い」についてIKETERUNO??
いやはや、すごいですね。
ちょっと今年ってどうなってんの?だれがコロナ明けこうなるって予測した?
わたしは10月後半にこのような記事を書きました。
そこでこんな風に締めくくっています。
高品質静止画の戦いはわりとてっぺんが近づいてきてるような気がして終わりが近いと思うで、次は多分AIアニメやAI 3DやAIゲームの方向に広がっていくんだろうなと感じてます。
いまから少しでもわたしも視野を広げておこうと思います。
いやいやいや、たしかに一か月前に高品質静止画の戦いはてっぺんが近づいてる~みたいなこと言ってたけど、こんなに早く戦い終わる??
気が付いたら「リアルタイム高品質お絵描き生成の戦い」と「高品質ビデオ生成の戦い」に入っちゃってました。
進化が早すぎてもう何が何だかですが、だからこそ情報を追うことをあきらめないようにしたいと思います。
がんばろう、みんな…!!
