見出し画像

【おすすめ6選】動画生成AIで何ができるのか試してみた

動画生成AIまとめ

AIというとどうしてもchat-GPTをはじめとする文章生成AIが注目されがちですが、2024年夏頃から動画生成AIの精度が非常に上がってきていて今後大きな流れを生みそうなので色々試してみました。

1, 「Dream Machine」(LumaAI)

Dream Machine

Dream Machine(2024年6月12日発表)、Runway Gen-3(2024年7月3日一般公開)が登場して、動画生成AIの作業に革新が起きつつあります。Dream Machineは動画の内容を指示するプロンプトと1枚の写真から5秒の動画を生成することができます。
使用してみた感想(2024年8月時点)
動画生成の精度、速度ともに以前のものからかなりグレードアップした印象があります。
例えば「街中を二足歩行で歩くワニ」と入力すると指示通りの動画がすぐに生成されてダウンロードまで出来ます。実際には起こらないような事柄でも簡単に生成されて、ちゃんと主体となるものの前や後ろにも人が通るのが面白かったです。

Dream Machine
無料プランでは月に30回の動画生成が可能
プロプラン(400クレジット)は月額約15,000円
プレミアプラン(2,000クレジット)は月額約80,000円

2, RunwayML(Runway)

Runwayは、AI技術を活用して次世代のアート、エンターテインメント、人間の創造性を形作るために活動しているAI応用研究企業です。
特徴としてはアプリ内で撮影した動画や端末に保存されている動画を、プロンプトを入力したり、画像やプリセットを選択したりしてまったく新しい動画に変換できる点です。
他にもText to Video、Image to Video、Image+Description to Videoなど様々な動画生成方法があります。

使用してみた感想(2024年8月時点)
無料版のみなので有料版はもっと精度が高いのかもしれませんが、少し動画生成の精度が高くないケースも見受けられました。
ただ、画像とテキストから動画生成できるのは非常に面白く可能性を感じました。
例えば鳥が木にとまっている画像と「Bird flying away from trees」というテキストで生成してみると以下のような動画が生成されます。

無料プランはプロジェクト3、720p HD画質動画ダウンロードなど
無制限プランは月額15,000円

3, Pika

Pikaは、「AIを活用したビデオ制作プラットフォーム」です。スタンフォード大学とハーバード大学の学術アドバイザーのサポートを受けていることでも有名です。現時点では公式サイトを使う方法とDiscordを使う方法の2種類あります。
例えば「A bird pecks at a plum blossom and then slowly flies away from the tree」(梅の木にとまっている鳥が花をつついた後にゆっくりと飛び立つ)で動画生成してみましたが、無料版だと長さが足りずに小鳥が飛び立つところまでは生成されませんでした。有料版だと行けるかもです。

4, Stable Video Diffusion

Stable Video Diffusion

Stable Diffusion(SD) がテキストから画像を生成するのに対し、本記事の主題である Stable Video Diffusion(SVD) は、テキスト、もしくは画像から動画を生成します。
2024年時点では画像から動画を生成する機能のみ公開されている状態です。
コカコーラのCMでも採用されて有名になりました。

動画再生時間 2-5 秒 フレームレート 最大30FPS(フレーム/秒) 処理時間 2 分以下

5 , Sora(OpenAI)

※現時点では一般公開なし
OpenAIのSoraは2024年2月発表されました。
玩具大手のトイザらスは2024年6月24日、OpenAIのSoraを使用して制作した初の商業広告を公開して話題を呼びました。
この広告は、トイザらスの創業者チャールズ・ラザラス氏の幼少期と、同社のマスコットであるジェフリー・ザ・ジラフをAIで再現したものでしたが「子供は気持ち悪くて不気味、感情は空虚」などの批判の声も多かった点も大きく報道されました。

現時点では一般には公開されていないので公開され次第実際に触ってみてレビューしたいと思います。

6, Veo(Google)

※現時点では一般公開なし
グーグルもOpenAIに対抗する形で、新たな生成AI動画モデル「Veo」を発表しました。
Veoは「60秒以上の高品質な1080pクリップを作成できる」能力を持ち、フォトリアリズムからシュールリアリズム、アニメーションまで、幅広い映画的スタイルに対応できるとのことです。「タイムラプス」や「風景空撮」といった映像関連用語も理解できるとのこと。グーグルによると、将来的にVeoの機能の一部をYouTube Shortsやグーグル製品にも導入する計画らしいです

こちらも現時点では一般には公開されていないので公開され次第実際に触ってみてレビューしたいと思います。

その他中国の動画生成AIサービス

中国Kuaishouの「Kling」(中国の電話番号が必要)
中国の動画生成AIサービスで、「Vidu」
現時点では中国の動画生成サービスもあまり触れるものが少ない状況ですが、今後触れるようになったら更新していく予定です。


いいなと思ったら応援しよう!

この記事が参加している募集