見出し画像

気になる生成AI備忘録-vol.8-動画生成AIのこと+画像生成AI「LetzAI V2」

■気になる生成AI備忘録とは
個人的に気になる生成AIのポスト(X)をまとめた備忘録を共有する連載シリーズです。

より気になるもの・深追いしたいトピックは当サイト『はじめての生成AI比較.com』にてUP予定ではありますが、サイトは生成AIはじめての方・初心者の方向け、こちらnoteでは、基本的には脱初心者目線で取り進めています。

今回紹介するのは、まさに備忘録といった形で個人的なメモレベルではありますが、一応。

まずはこちらのXのポスト

なかなかの長文となっていますが、日本語では以下のような内容となります。

ドライバーとして、なぜフェラーリを所有することにこだわる必要があるのでしょうか?

私たちは映画を作っているわけではありません。映画はあまりにも複雑で、規模が大きく、コストがかかりすぎます。私たちがやっているのは、新しい形の「文学テキスト」です。それは芸術的に解釈されることができ、莫大な感情的価値を提供することができ、計り知れない可能性を秘めています。

最近、私はPixVerseのチームとつながり、ジェネレーティブAIについて日々考えている人たちと長時間話をしました。

OpenAIの #SoraAI は、おそらく商業的に非論理的な製品であるという点で同意しました。彼らは #ChatGPT を動かすためにインフラレベルでできることはすべてやってきましたが、それでも時々問題が発生します。SORAのようなビデオの精度と長さを実現するために、彼らがどのくらいの価格とコストを払わなければならないかを想像するのは難しいです。

しかし、私たちはまた、このようなことが起こることを心から望んでいます。これは、本物のクリエイターにとってどれだけの大きなチャンスになるでしょうか?そして、それはどのようにクリエイティブなプロセスと配信プロセスを短縮するでしょうか?あまりにも多くのインスピレーションに駆り立てられて狂ったようになってしまった人々を、どれほど救うことができるでしょうか?一方、プロペラ時代の到来とともに、戦争の形、物流の形、兵士の思考の形を劇的に変えるジェットエンジンが登場しました。

インスピレーションは私たちが所有しており、機械のコントロールも私たちが所有しています。ドライバーとして、なぜフェラーリを所有することにこだわる必要があるのでしょうか?

Pixverseが提供してくれた公式サポートとリソースに感謝します。次に、業界内でのつながりを利用して、クリエイターのためのエコシステムを構築しようとしています。私たちの共通のビジョンは、才能あふれるクリエイターたちがクオリティの高いAIコンテンツを制作することで、家賃を払えるようにすることです。同時に、より多くの人々が参加するよう促し、最終的にコンテンツの制作・配信方法を永遠に変革させることです。

その計画の一環として、私は2日間かけて、私のAIショートフィルム「The Complex」をPixVerseでリメイクしました... 今回は自分自身のために。

長い内容ですが、まず含まれているワードから

・OpenAI→革命的な動画生成AI「Sora」の開発元であり、ChatGPTの開発元でもある
・Pixverse→動画生成AI(テキストプロンプトまたは画像から動画生成が無料で可能)

では、この方が言わんとされているであろう要点を掘り下げる前に、「ドライバーとして、なぜフェラーリを所有することにこだわる必要があるのでしょうか?」という部分について、個人的にはですが

フェラーリは高価で手の届かないもの、実用性よりも所有することにこだわるのはナンセンスであるという比喩

だと、私は解釈しました。

また、Soraをフェラーリとして見立てているようですが、これはSoraを批判等したいスタンスではなく、

高級車じゃない車でも(車を)創意工夫して色々カスタムするのは良いものだよ

という、暗にそういったメッセージが込められているようにも感じられました(深読みしすぎかもですが)。

要点として、一番何を言わんとしているのかですが、

AIによるコンテンツ制作の可能性を強調し、クリエイターがAIを活用して高品質なコンテンツを制作し、生活していくことができるようなエコシステムの構築を目指している

ということを、動画生成AIのPixverseを通して、言いたいのだろうと思われます。

また、気になるのが

「OpenAIの #SoraAI は、おそらく商業的に非論理的な製品である」という部分です。

これも推測は難儀ではなく、

「Soraは技術的に非常に高度な製品だが、開発コストや利用料金が高いために、商業的に成功するのは難しいだろう」

といった意味合いだと捉えられます。

確かにユーザー目線である

・利用料金
・ハードウェアの要求が高い

この2点は非常に重要だと思います。

私個人的にも、別記事でも触れたようにSoraは凄いと思います。

凄いと思いつつも、いざ一般利用可能となった際、はいわかりましたと二つ返事で使えるのだろうか、とも考えます。

単純にこれだけのクオリティの動画生成が可能だという点からも、利用料金やハードウェアの要求が高くなるのではないかと考えるのは、おおよそ普通だとも言えます。

利用料金は、まったくもってわからないところですが、個人的には月額1万円くらいにはなるような気はしています。

ハードウェアの要求面でいうと、Stable Diffusionをローカル環境で利用する際の推奨スペックは

OS:Windows(64bit)
CPU:Core i5~Core i7(Ryzen 5~7)
VRAM:12GB以上(RTX 30シリーズやRTX 40シリーズ)
メモリ:16GB(学習させるなら32GB)
ストレージ:512GB以上(1TBなら望ましい)

とされています。おそらく、↑のスペックが最低限という感じかな?とは思っています。

少し話が逸れてしまった感がありますが、↑のXのポストが目に付いて気になりました。




そして、もう1つ気になったXのポストがこちらです。

こちらまず日本語にすると

本日より、LetzAI V2は一部のユーザーを対象に、アーリーアクセステストを開始。

私たちは、アップデートされたプラットフォームが誰にとっても使いやすく、安全で、楽しいものであることを確認している。

といった意味合いになるのですが、「LetzAI V2」というのは画像生成AIです。

↑のような画像生成が可能ということがわかります。(画像生成後、高解像度へのアップスケールを行っているようですが)

気になったのでLetzAIのWEBサイトにアクセスし、メールアドレスでサインインを行おうとしたら

このように表示されました。こちらは日本語にすると

LetzAI はあなたの国ではまだ利用できません。

待機リストに参加してください

という内容になります。

どうやら早期アクセスも段階的にといった形なのだと思われます。

気になったものの、日本で普通に利用するにはまだ数か月先にはなりそうです。

いいなと思ったら応援しよう!