～AIの進化が止まらない！巷で話題の「sora」とは？～

2024年2月22日 18:51

※本記事は毎週水曜日に配信される「維新エンタメ通信」の転載です。

こんにちは！維新エンターテインメントで企画営業をしているドラゴンです。
皆さんは最近巷で話題になっている動画生成AI「sora」をご存じでしょうか。
このエンタメ通信でもAIについて取り上げたことがありましたが、最近のAIはものすごいスピードで進化を続けています。少し前までは、「数年後にはこんなこともできるかも…」と言われていた技術が、気づけばできるようになっていることも珍しくありません。
ということで今回は、AI界隈を騒がせている次世代動画生成AI「sora」について解説していきたいと思います。
確実に来るAIの波に乗り遅れることがないよう、こまめにAIについて学びましょう！

1. soraとは？

soraというのは、Chat GPTの開発元であるOpenAIによって開発された動画生成AIです。
テキストのプロンプト（指示文）によって高解像度の動画を最長1分間まで生成することができます。
ちなみにですが、この「sora」という名前は、「無限の可能性を呼び起こす」ことをコンセプトとしており、日本語の空が由来になっているそうです。
2月18日には、Chat GPTの公式Ｘアカウントが「空色デイズ」と日本語で投稿しているなど、かなり日本を意識している様子がうかがえます。

2. soraでできること

それではOpenAIが発表しているsoraの性能を見ていきましょう。

【テキストによる動画生成】

冒頭でもお話ししたとおり、soraは短いプロンプトから動画を生成することができます。
DALL-E3の導入によって、Chat GPTとのやり取りで画像生成ができるようになった！と、このエンタメ通信でお知らせしたのもつい最近のように感じますが、それと同様の操作で動画を生成することができます。
プロンプト自体は短くとも、Chat GPTによってより詳細な内容に内部的に変換することで、ユーザーの意向に沿った高品質な動画が生成されるようになっています。
例えば、以下の画像は実際に Open AIの公式HPにて公開されている動画の一部（動画はメルマガだと掲載できないため、ご勘弁ください…）です。

こちらを生成したプロンプトは以下のとおり。
（実際には英語で指示されています。）

スタイリッシュな女性が、きらびやかにネオンが輝くアニメのような東京の街路を歩いています。
彼女の服装の特徴は、黒いレザージャケット、長い赤いドレス、黒いブーツ、黒いバッグ、サングラス、赤い口紅です。
彼女は堂々と、ゆったりと歩いています。
道路は濡れており、カラフルなライトが鏡のように反射しています。
周りには多くの歩行者が歩いています。

たったこれだけで現実と見紛うほどの高画質な動画が生成されてしまうとは驚きですね。
そして、また「東京」という日本ワードが飛び出しています。
日本で何か大きなことをする想定でもあるのでしょうか。個人的には、プロンプトを日本語で入力できるようにしてくれるととてもありがたいところです。
まぁそれもAIを使って英訳すればいいだけの話なのですが…

【画像からの動画生成】

上で散々soraについて熱弁したところですが、soraのすごさはそれだけではありません。
画像と併せてプロンプトを入力し、画像の前後を拡張し、動画化することができます。
画像だと流石にちょっとわかりにくいのですが、以下の画像は左側が元の画像、右側がそれをもとに生成された動画の一部です。
Open AIが出しているレポートの真ん中手前くらいに、この技術について書いてあります…
こちらのレポートを見れば、実際に動いている様子を見ることができるのですが、まさか一枚の画像からできているとは思えないくらい自然に動いています。
そしてなんとこれは画像からだけでなく、もともとある動画を拡張することも可能とのこと。
画像を動かしながら無限にループする短い動画なども生成できるようですので、動画制作の幅が広がりますね！

【動画の編集】

こちらも驚くべき機能なのですが、なんとsoraは一度生成した動画をもとに、別の物に作り変えることができます。
動画を撮ってみたはいいけれど、なんだか味気ない、物足りない…なんて時は、soraを使えばすぐに解決できてしまうかもしれません。
今までは実際に撮り直したり、CGを制作したりして対応していた作業がAIによって一瞬で完了できるとなると、動画制作にノウハウがなくとも、多くの人が自分でイメージ通りの動画を生成することができるようになる日は、そう遠くないような気がしてきます。

【複数の動画を繋げる】

画像から動画を生成したり、動画の前後を拡張できるということは、つまり複数の動画を自然につなげることができるということです。
ドローンが遺跡を飛んでいる動画と、水中を優雅に飛ぶ蝶の動画を繋げることもできてしまいます。
何を言っているんだこいつはと思う方は、ぜひ先ほどのレポートを下にスクロールしてください。例によって画像では伝わりません…。

このほかにも、画像生成ができたり、ゲーム画面を再現してシミュレーションできたりと、soraでできることは盛りだくさんです。ビジネス、プライベート問わず、本当にいろいろなシーンで使うことができそうですね！

3. これまでの動画生成AIとの違い

これまでも動画生成AI自体はあったのですが、なぜsoraがここまで騒がれているのかというと、それは上で紹介した機能だけではありません。

・最長1分間という圧倒的な長さ
・背景が動くだけではなく、人物等も動いたうえでの自然な動画生成
・車が動いたら土煙が上がる、クッキーを食べたら歯形が付くなどの物理的な因果関係

などなど、これまでの動画生成AIで課題として挙がっていた点が軒並み解決されているのです。
ただ、一方で、コップが倒れてもガラスが割れる描写無しに中の液体がこぼれてしまうなど、課題もまだ残っているようです。
それでも、ここまで一気にAIが進化したのなら、これらの課題もそう遠くないうちに解決されそうな気がしてきますね！

いかがでしたでしょうか。
本日は最近話題の動画生成AI「sora」をご紹介しました。
残念ながらまだ一般ユーザー向けのリリース日は公開されておりませんが、夢とロマンにあふれる技術であることは間違いないですね！
僕は趣味でゲーム実況の動画制作をしている身ですが、できることがたくさん増えそうでワクワクしています。僕が好きなゲーム実況者さんがよく取る手法なのですが、そのゲームのプレイ動画を模した独自のオープニングムービーとかとても楽しそうですよね…それがサクッと作れるとなると、それだけでモチベーションが爆発しそうです。

この記事が役に立ったという方は、ぜひ職場の皆様にもご共有ください！