動画生成AIツール最前線:特徴から生成能力まで徹底比較!
👋こんにちは!
日々めざましい進化と新しいツールが生まれ続けている動画生成AIツール業界ですが、とても変化が早くて把握が難しい状況だと思います。
今回は、共通の画像を使ったimg2vidを通してそれぞれどんな特徴があって、現状どれぐらいの生成能力なのかを比較することで動画生成AIの現在地を把握するのにお役立ていただければと思います。(評価は独断です🙇♂️)
ご興味がある方はぜひ最後までお読みください。記事がお役に立ったら、フォローやスキをいただけると励みになります🙏
◇今回比較する動画
大前提として、動画生成AIはSeed値を利用したランダム要素があり、たまたま良い結果が得られたというパターンも存在しますので統計的な比較ではありません。ここではおよそ10回程度の試行回数で得られた中で最良のものをチョイスしています。
共通の画像から生成した動画をVeed.ioで繋げて編集しています。
いずれも共通の画像を使用して、プロンプトは最低限指定しているものや、何も指定していないものもあります。アップスケール等や尺の延長などは行っていません。
👇まずはこちらの動画をご覧ください。
◇動画生成AIの一覧
この検証動画とその過程で得た経験を元に以下の3つの指標を元に評価してみたいと思います。
・アニメーション:自然な動きであるほど星が多い
・安定性:生成結果が破綻しない確率が高ければ星が多い
・カスタム性:生成動画の編集ができるなど機能性が高ければ星が多い
・価格:各プランの価格を掲載(価格は頻繁に更新されますので最新の情報は公式HPからご確認ください)
オリジナル画像
Midjourney V6で生成。
Midjourney公式HP
○Based Labs AI
アニメーション:★★★★★
安定性:★★
カスタム性:★★
価格:$15~$35/月 (制限付きの無料プランあり)
[解説]
モデル「I2VGen-XL」 を使用して生成しました。
現状2秒程度の短い動画になるため、尺の関係で2点ピックアップしています。オリジナルの作風をかなり忠実に再現できていて画質もかなり綺麗です。動きについては、ダイナミックではないもののかなり細かく自然な動きが作れています。
ただし、動きが大きくなる場合は高確率で破綻していました。
よってリアル系モデルを使用しつつコンパクトな動きを指定できればハイクオリティな動画が作成できる可能性が高いと言えそうです。
無料でもある程度使うことができますが、生成にサイト内通貨を消費します。ツール内で作成した動画のアップスケール(サイズアップとFPS向上)が可能です。
○PIKA 1.0
アニメーション:★★★★
安定性:★★★★
カスタム性:★★★★
価格:$8~$58/月 (制限付きの無料プランあり)
[解説]
PIKAは現時点ではRUNWAYと並んでハイクオリティな動画が作成できるツールの代表格です。動きが大きいのに破綻が少なく、安定した動画生成が可能です。今回も人物の顔の特徴をかなり似せた上で一貫した動画を生成できました。
リアル系のモデルの場合、若干ぼやけたような感じが強く出る印象ですが、アニメーションのクオリティは高いです。有料プランなら出力した動画のアップスケールも可能なのでぼやけも解消できる可能性があります。
その他にも生成動画に4秒追加したり、キャンバスサイズ変更や、動画の部分修正など高いカスタマイズ性があることも強みです。
○PixVerse
アニメーション:★★★
安定性:★★★
カスタム性:★★
価格:無料
[解説]
まずハイクオリティな動画生成AIを無料で何度でも試せるという意味では、動画生成AIにチャレンジしてみたい方にとって非常に良いツールだと思います!
いつ有料化してもおかしくないので、まだチャレンジしたことが無い方はぜひお試しください。
アニメーションは他のツールと比べるとやや控えめな動きが多く、大きな動きになると破綻するケースが多かったです。参照元の画像の再現度は高めでした。また、プロンプトは無しでもある程度画像に合わせた動きを生成してくれます。
少し時間はかかりますが無料であることの利点を生かして良い動画が生成できるまで粘っても良いかもしれません。
○Runway gen-2
アニメーション:★★★★★
安定性:★★★
カスタム性:★★★★★
価格:$12~$76/月 (制限付きの無料プランあり)
[解説]
PIKAと並んで、ハイクオリティな動画生成AIの代表格です。
今回の動画でも風に靡く髪が美しく表現されていて、カメラが引いていく構図も自然です。高いアニメーション生成能力が伺えます。
人物の顔や作風は他のAIツールと比べると離れているようにも見えますが、破綻の無い動画が生成出来ています。
無料で付与されるトークンも多めのため、ある程度は無料で試すことができます。
動画に関する機能は非常に多彩で、アップスケール等はもちろんモーションブラシのような部分を指定して個別に動かすこともできます。
実写系に強いモデルで、大きな動きやフレーム外の情報を拡張して生成する能力に長けており、カメラコントロールに対応しています。
○Stable Video Diffusion(SVD)
アニメーション:★★★★★
安定性:★★★★
カスタム性:★
価格:無料
[解説]
Stable diffusionでおなじみのStability AI社の動画AIモデル。Stability AIの公式HPの紹介によると、PIKA等の他社製ツールと比較してハイクオリティな動画が生成できるということで話題になりました。
実際に試してみても動画は高解像度かつ高FPSで出力すればかなりの再現度と動きのダイナミックさ、滑らかさがあり、また破綻が少なく安定しています。ただし、高画質の動画を出力するのにはそれなりに時間がかかります。(RTX4090を使用して、1344*768 8FPSの3秒で8分~10分ぐらいです)
テキストからの動画生成には対応しておらず、プロンプトを指定することができないので参照元の画像を読み取ってアニメーションをつけていくツールです。ローカル環境に実装することができ、ある程度のスペックのPCであれば無料で何度でも試せるため、ハイクオリティなデモという印象です。
◇検証結果について
今回の比較検証では、出力できる尺こそ短いですが『Based Labs AI』が最も自然で参照画像の再現度が高いと感じました。まさに写真の人物がそのまま動き出したような感じに見えました🙌
あくまでも、最低限のプロンプトだけで行った比較検証のため、より最適化されたプロンプトと画像素材を利用することで結果は変わってくると思います。特にRUNWAYやPIKAは編集性も高いツールなので、使い方によってはもっとクオリティが高くできそうです。
◇アニメ系画像で動画生成を比較
今回使用したイラストは少し厚塗りテイストのためセルアニメ系とは挙動は異なる可能性はありますがAIによって得手不得手が結構はっきりと分かれたと思います。
あくまでも各10回ほどの少ない試行回数での生成の結果なので信頼性はそれほど高くはないですが、この動画から現時点のイラスト系動画の生成精度について序列をつけると以下のような並びになりそうです。
【イラスト得意】→【イラスト苦手】
・Stable Video Diffusion >PIKA ≧ Based labs > PixVerse >RUNWAY
Stable Video Diffusionはまだ試験運用で、研究目的の利用だけ認められている状況ですが大きな動きをしても破綻が少ない動画が生成できる時があるので、正式なリリースが待ち遠しいですね。
また、RUNWAYに関しては現時点では実写系だと安定してハイクオリティですがイラスト系はあまり良い結果が得られませんでした。
ある程度、作りたい動画の方向性に合わせてツールを選択する必要がありそうです。
ここから先は
Amazonギフトカード5,000円分が当たる
皆さまの温かいサポートのおかげで、活動を続けることができています。もしよろしければ、引き続き支援をお願いできますと幸いです。より質の高い記事投稿に励みます!