今すぐ使える最高のAIビデオジェネレーター

2024年12月26日 20:28

11,072 文字

現在利用できる最高のAIビデオジェネレーターについてお話ししたいと思います。Cingが最近バージョン1.5から1.6にアップグレードされたので、このビデオではそれについて詳しく見ていきます。私はCing 1.6を一連の難しいプロンプトでテストし、Googleの伝説的なV2を含む、現存するトップクラスのビデオジェネレーターと比較してみます。
V2をまだご存知ない方もいるかもしれませんが、これは間違いなく最高品質のモデルです。他とは比べものにならないほど優れていますが、ここで注意点があります。私を含め、ほとんどの人はまだこれにアクセスできません。現在は早期テスターのみが使用可能です。
では、次に良い選択肢は何でしょうか？ここにV2のページからいくつかの指標があります。V2と主要なモデル、つまりMetaのMovie Gen、Cing version 1.5、Minimax、そしてOpenAIのSora Turboとを比較しています。赤い部分は、競合するビデオジェネレーターがGoogleのV2より好まれた事例です。
全体的な好ましさの点で、Cingが最も高い赤の割合を示しています。プロンプトへの忠実度、つまりビデオがプロンプトにどれだけ従っているかという点でも、Cingは他のビデオジェネレーターと比べて最も高い赤の割合を示しています。このチャートから、Cing 1.5は現在使用可能なV2の次善の選択肢と言えます。そして注目すべきは、これはまだ1.5の段階だということです。
今日は1.6について見ていきましょう。使い方は非常に簡単です。Cingにログインするか、無料でサインアップするだけです。ウェブサイトへのリンクは説明欄に記載しておきます。ログインしたら、AIビデオをクリックしてビデオの生成を開始できます。
実際には2つのオプションがあります。テキストからビデオを生成する方法では、ここにプロンプトを入力してビデオを生成できます。また、画像をアップロードして、それをビデオの開始フレームや終了フレームとして使用することもできます。これについては後ほど説明します。
まずはテキストからビデオを試してみましょう。上部でモデルを選択できます。最初のテストプロンプトとして、「砂漠でユニコーンに乗る宇宙飛行士」と書いてみます。これは多くの要素が含まれており、おそらくトレーニングデータにはない組み合わせなので難しい課題です。
Cingを初めて使用する場合、このクリエイティビティスライダーがあります。これを左にスライドすると、より創造的になりプロンプトへの忠実度は下がります。右に全部振ると、プロンプトにより忠実に従います。私はデフォルトの0.5のままにしておきます。
ここで標準モードとプロフェッショナルモードを選択できます。もちろんプロフェッショナルモードの方が品質が良いので、それを選択します。動画の長さとアスペクト比は分かりやすいのでデフォルト値のままにしておきます。
下部には負のプロンプトを追加することもできます。これは画像から除外したい要素を指定するものです。他のビデオジェネレーターの中にはこの負のプロンプト機能がないものもあるかもしれないので、今回は空白のままにしておきます。
それでは生成してみましょう。結果が出ました。興味深いことに、後ろからの視点で生成されましたが、全体的に悪くありません。これは宇宙飛行士で、ユニコーンに乗っています。ユニコーンは砂漠を現実的に歩いており、歩く際に砂を蹴り上げています。全体的に悪くない生成結果だと思います。
比較のために、同じプロンプトで他のトップクラスのビデオジェネレーターを使用した結果をお見せします。こちらがCingの前バージョン1.5、こちらがMinimax、そしてこちらがオープンソースのHunanです。この最初のプロンプトはそれほど難しくないので、実際に4つのビデオモデルすべてがすでにうまく生成できています。コメント欄でどれが良いと思うか教えてください。
次のプロンプトは「シェフになるために学ぶポメラニアンの子犬たちのグループ」と書いてみます。これも難しいプロンプトです。なぜなら、トレーニングデータでは見たことがないような内容だからです。さらに、単なる犬ではなくポメラニアンの子犬でなければならず、シェフになるために学んでいるという設定も生成するのは難しいでしょう。設定は全て同じにして生成してみましょう。
結果が出ました。興味深いですね。これは通常のポメラニアンの子犬らしくありません。通常のポメラニアンはこのような感じのはずです。この点では減点せざるを得ません。これらが本当にポメラニアンかどうかわかりません。
参考までに、他のビデオジェネレーターで同じプロンプトを試した結果をお見せします。4つとも詳細は十分に良好で、ポメラニアンの特徴も一貫していますが、興味深いことにCing 1.6だけがポメラニアンらしく生成できませんでした。
次は皆さんお気に入りのプロンプト「スパゲッティを食べるウィル・スミス」です。設定は全て同じにして生成します。
結果が出ました。明らかに私が意図したウィル・スミスではありませんが、おそらくトレーニングデータのどこかにこのような白人のウィル・スミスという人がいるのかもしれません。しかし、それはかなり疑わしいですね。
Cingは歴史的に食事シーンの生成が最も得意でした。この人物はスパゲッティを食べ、咀嚼する動作に問題はありません。このビデオジェネレーターで気になる点は、テーブル上のフォークが多すぎることと、一部のフォークの歯が余分についていることです。不気味な感じです。
参考までに、他のビデオジェネレーターで同じプロンプトを試した結果をお見せします。興味深いことに、これらの中でMinimaxだけがプロンプトだけでウィル・スミスを生成できました。
とは言え、Cingには画像からビデオを生成する機能もあります。本当にウィル・スミスがスパゲッティを食べるビデオを生成したい場合は、まずウィル・スミスがスパゲッティを食べている画像を生成し、それを開始フレームとしてここにアップロードして生成することができます。ただし、テキストからビデオを生成する場合は、ウィル・スミスのような有名人をうまく生成することはできないことに注意してください。
次は、他のビデオジェネレーターではまだ正確に生成できていない、非常に難しいプロンプトです。「美しい光り輝く白いドレスを着たプリンセスが、赤く光る目を持つ巨大なドラゴンから逃げる。ディズニー・ピクサーのアニメーションスタイル」というプロンプトです。設定は全て同じにして生成します。
結果が出ました。プリンセスは明らかにディズニー・ピクサースタイルではありません。とてもリアルなプリンセスです。光り輝く白いドレスは着ています。ドラゴンはディズニー・ピクサースタイルなので、その点は評価できます。ただし、赤く光る目は持っていませんし、プリンセスもドラゴンから逃げているというより、横向きに走っているだけのように見えます。
これは他の主要なビデオジェネレーターでも同じ欠点が見られました。どのプリンセスもドラゴンから実際に逃げることができませんでした。ディズニー・ピクサースタイルの生成に関しては、Minimaxに軍配が上がります。このタイプのスタイルの生成が本当に得意です。
次は、テキストを生成できるか試してみましょう。プロンプトは「"私のチャンネルを購読してください"というネオンサイン、サイバーパンクな夜の街」です。設定は全て同じにして生成します。
結果が出ました。最新のCing 1.6でも、ビデオ内のテキストをうまく生成することはできません。参考までに、他のビデオジェネレーターで同じプロンプトを試した結果をお見せします。Minimaxはかなり良好で、ビデオ内で実際にまともなテキストを生成できる唯一のモデルです。この点でもMinimaxに軍配が上がります。
次は、アニメを生成できるかテストしてみましょう。プロンプトは「京都の街を歩く着物姿の少女、アニメスタイル」です。設定は全て同じにして生成します。
結果が出ました。興味深いことに、ユニコーンに乗る宇宙飛行士のビデオでも見られたように、少女の後ろからの視点で生成されました。ある程度アニメスタイルには見えますので、その点は評価できますが、細部は優れているとは言えません。
参考までに、他のビデオジェネレーターで同じプロンプトを試した結果をお見せします。興味深いことに、少なくともアニメに関してはCing 1.5の方が1.6より優れています。この生成結果は本当に良好です。また、Hunanの生成結果も私が求めていたアニメスタイルです。アニメを作りたい場合、Cing 1.6は最適な選択肢ではないかもしれません。
次のプロンプトは「泣いている女性、とても悲しく苦悩している」です。これは、より一般的でない、あるいは極端な表情を生成できるかテストするためのものです。他の設定は全て同じにして生成します。
結果が出ました。これは完璧です。女性は泣いており、明らかにとても悲しく苦悩しています。プロンプトを見事に反映しています。参考までに、他のビデオジェネレーターを並べて比較してみましょう。現存するトップクラスのビデオジェネレーターは、すでにこのような極端な表情をほとんど、あるいは全て処理できることに注目してください。コメント欄でどれが良いと思うか教えてください。
次は、よりアクション性の高いシーンを生成する能力をテストしたいと思います。プロンプトは「戦火に見舞われた街を走る兵士の主観視点ショット、手には小銃を持つ。カメラは素早く動き、近くで爆発が起き、瓦礫が舞い上がる。兵士が身を隠し、敵に向かって発砲する際に、視点が上下し揺れる」です。生成して結果を見てみましょう。
おや、面白いですね。実際にCing 1.5では生成できたのに、「生成に失敗しました。別のプロンプトを試してください」というエラーが出ました。ガードレールが強化されたようです。戦争に関連する内容だったため、このビデオの生成が制限されたのだと思います。
では次のプロンプトに進みましょう。戦争の代わりにホラー映画を試してみます。「地下鉄の駅で人々を襲うゾンビの群れ、手持ちカメラ」です。他の設定は全て同じにして生成します。
結果が出ました。人々の一貫性は以前のバージョンのCingよりも若干良くなっているように思います。どれがゾンビで、どれが一般の人々なのかは明確ではありませんが。近くで見ると、キャラクターが動く際に手や顔が歪んでいますが、以前のバージョンよりは明らかに良くなっています。
比較のために、同じプロンプトで他のビデオモデルを試した結果をお見せします。興味深いことに、最新のCing 1.6は何らかの理由で、他のモデルほど恐ろしい雰囲気を出せていません。
次のプロンプトは「嵐の海から巨大な海獣が現れ、その巨大な触手が沈みゆく船に絡みつく」です。これも高アクションな壮大なシーンのテストです。生成して結果を見てみましょう。
結果が出ました。確かにこれは巨大な海獣ですが、沈みゆく船に触手が絡みついているわけではないので、その点は減点せざるを得ません。また、触手の一貫性もあまり良くありません。参考までに、他のビデオジェネレーターで同じプロンプトを試した結果をお見せします。
どれも完璧ではありませんが、もし勝者を選ぶとすれば、私はCing 1.5を選びます。これも興味深いですね。Cing 1.6は何らかの理由で、より検閲されているか制限されているようです。戦火の街を走る兵士は生成させてくれず、ゾンビも他の生成結果ほど血なまぐさくなく、海獣でさえ沈みゆく船を破壊することができません。でもコメント欄でどれが良いと思うか教えてください。
最後のプロンプトに移りましょう。その後、Googleの伝説的なV2との比較にも移ります。プロンプトは「街に迫る巨大な邪悪なパンダ、建物を破壊する。恐怖に駆られた人々があらゆる方向に逃げ惑う。ハイアクション」です。生成して結果を見てみましょう。
結果が出ました。確かにこれは巨大で邪悪そうなパンダです。ただし、人々は恐怖に駆られてあらゆる方向に逃げ惑っているようには見えません。しかし、細部の品質は本当に良好です。建物や人々など、全てがとても鮮明で一貫性があり、高解像度です。ただし、人々はこのパンダを全く恐れていません。実際、逃げ出すどころか、なぜかパンダに向かって歩いていっています。
参考までに、他のビデオモデルで同じプロンプトを試した結果をお見せします。興味深いことに、この場合もCing 1.5の方が好ましいと思います。他と比べてより邪悪そうなパンダになっています。そしてMinimaxとHilaに関しては、カンフー・パンダからパンダをコピーしているようで、面白いですね。これはトレーニングデータについてのヒントを与えてくれるかもしれません。
次に、Cing 1.6を伝説的なGoogle V2と比較したいと思います。私はまだV2にアクセスできないため、先ほど使用した一連のプロンプトでV2の生成結果をお見せすることはできません。しかし、オンラインにはプロンプト付きのGoogle V2のサンプルビデオがいくつかあります。そこで、同じプロンプトをCing 1.6にコピー＆ペーストして、V2の生成結果と比較してみたいと思います。
最初の例は「木製のまな板の上で熟したトマトを器用に切る手のペア」です。結果を見てみましょう。
結果が出ました。悪くありません。実際にトマトを切っています。Soraを含む他のビデオジェネレーターは、トマトを適切に切ることさえできませんでした。ナイフを持つ手とトマトを押さえる手は非常にリアルで、両手とも5本指があります。指摘できる唯一の欠点は、最後のトマトのスライスが正しく見えないことです。
これはトマトを切ることさえできないSoraと比べると素晴らしいですが、このシーンを完璧に生成できるV2には明らかに及びません。
次はV2のサンプルビデオの別のプロンプトをCingに貼り付けて、生成できるか見てみましょう。プロンプトは「遠景のショットがズームインし、金色のヘルメットを着けた騎士が現れる。彼はゼブラに乗って突進し始め、槍を下げて時計仕掛けのタコに向かって突進する」です。これは非常に難しいプロンプトで、V2でさえ正確に生成できませんでした。生成して結果を見てみましょう。
結果が出ました。実際にプロンプトへの忠実度はとても良いと言わざるを得ません。確かにこれは金色のヘルメットを着けた騎士で、ゼブラに乗り、槍を持って何かに向かって突進しています。プロンプトでは「時計仕掛けのタコ」と指定されていますが、これは時計仕掛けのタコには見えません。
とは言え、V2の生成結果と比較すると、そちらにも多くの欠点があります。5秒の中で3つのシーンに分かれているので、一貫性がありません。私は本当に、騎士が時計仕掛けのタコに向かって突進するシーンを見たかったのですが、V2ではそれが見られません。騎士が槍を持つ姿も不気味に見えますし、槍を下げてタコに向かって突進してもいません。つまり、両方のビデオに明らかな欠点があります。コメント欄でどちらが好みか教えてください。
AI Portraitの提供でこのビデオをスポンサーしていただき、ありがとうございます。LinkedInやビジネスプロフィールの良質なプロフェッショナル写真は大きな違いを生みます。自分で撮影したり、友人に依頼したりすることもできますが、ほとんどの人はプロフェッショナル写真の撮影が得意ではありません。プロのフォトセッションを依頼することもできますが、平均して200ドル以上かかり、さらにセッションのスケジュールを調整し、カメラの前で何時間も不自然なポーズを取る必要があります。
そこでAI Portraitの出番です。数分で高品質なプロフェッショナル写真のポートフォリオを生成できます。写真を1枚アップロードし、性別を選択するだけで、様々な設定での50枚のプロフェッショナルヘッドショットのポートフォリオを数分で生成します。実際のフォトセッションの手間なしに高品質なプロフェッショナル写真が必要な場合、AI Portraitが最適な選択です。説明欄のリンクからチェックしてみてください。
次は、Google V2のサイトから直接取得した別のプロンプトです。これらのクリップはV2のサイトで紹介されているため、チェリーピックされた例かもしれません。このプロンプトはV2では非常にうまく機能するかもしれませんが、他のビデオジェネレーターではそうではないかもしれません。そのため、若干のバイアスがありますが、それでもこのプロンプトをCingにコピー＆ペーストして、結果を見てみましょう。
プロンプトは「陽光あふれるプールで、ふわふわのコッカプーが鮮やかなピンクのフラミンゴフロートの上に座っている様子をシネマティックなショットで捉える」などです。生成して結果を見てみましょう。
結果が出ました。悪くありません。犬は非常にリアルに動き、フラミンゴフロートもプールに浮かぶ様子がリアルです。唯一の欠点は、フラミンゴの頭が正しくないことです。目が欠けており、さらに頭と首全体が何故か毛皮のようになっています。比較のために、2つのビデオを並べてお見せします。
次のV2プロンプトは「浅い被写界深度のミディアムショットで、1980年代のキッチンで直立して座る、ウェーブのかかった茶色い髪のかわいい漫画の少女を描写。彼女の髪は中程度の長さでウェーブがかかっており、小さな少し上向きの鼻と小さな丸い耳を持つ。彼女はカメラに向かって話すときとても生き生きとして興奮している」です。スクロールダウンして生成してみましょう。
結果が出ました。これは本当に良好です。彼女は興奮しており、カメラに向かって話しています。Cing 1.6とV2の比較を並べてお見せします。両方とも非常に似ています。このようなアニメーション3Dシーンを生成したい場合、V2を待つ必要はありません。今すぐCing 1.6を使って、これを生成することができます。とても印象的です。
次のV2プロンプトは「フレームの中央に被写体を配置したトラッキングショットで、雲の中に浮かんでいるように見えるアイスリンクを滑るスケーターを追う。スケーターは、動きのたびに波打つ光り輝く白いコスチュームを着て、幽玄な優雅さを醸し出している。背景は柔らかく移り変わる雲とパステルカラーの渦巻くキャンバスで、超現実的な不思議さを演出している」。すごいですね。スクロールダウンして生成してみましょう。
結果が出ました。確かにこれはスケーターで、動きのたびに波打つような白いコスチュームを着て、幽玄な優雅さを醸し出しています。背景はパステルカラーの渦巻くキャンバスと柔らかく移り変わる雲です。プロンプトにとてもよく従った、本当に良い生成結果です。
こちらがV2の生成結果です。V2の方がよりアクション性が高いですが、それはプロンプトでは指定されていません。彼女はフィギュアスケーターのように見えますが、プロンプトではフィギュアスケートとは指定されていませんでした。単にアイススケーターと書かれているだけなので、このように回転する必要はありません。
コスチュームが動きのたびに波打ち、幽玄な優雅さを醸し出すという点では、実際にCing 1.6の方がプロンプトのその部分をより良く処理していると思います。しかし、リアリズムと一貫性、解像度という点では、V2の生成結果の方が若干好ましいと思います。ただし、両方とも本当に良好です。コメント欄でどちらが好みか教えてください。
次は、プロンプトの付いたV2の生成結果をもう1つ見つけました。プロンプトは「戦場と化した街を進む未来的な戦闘マシン、複数のカメラアングル、シネマティック」です。結果を見てみましょう。
結果が出ました。これは確かに未来的な戦闘マシンに見えます。複数のカメラアングルではないので、5秒の生成の中でシーンからシーンへの切り替えはできないようです。しかし、それ以外は本当に良好で、細部は非常に鮮明で高解像度です。
参考までに、V2の結果をお見せします。これはCing 1.6の戦闘マシンとは全く異なる戦闘マシンで、V2では約6秒の生成の中で異なるカメラアングルに切り替わります。コメント欄でどちらが好みか教えてください。
次のプロンプトは「鏡を見て吠える猫が、鏡に映る自分の姿をライオンとして吠えているのを見る」です。これができるか見てみましょう。
結果が出ました。確かに猫は鏡の中の自分を見ています。鏡の物理的な特性を理解していることがわかります。猫が動くと、鏡の中の反射も猫の動きに合わせて揃っています。しかし、プロンプトでは鏡の中で自分をライオンとして見ると指定されていますが、その部分は反映されていません。
参考までに、V2のビデオをお見せします。V2はこれを見事に処理していますが、鏡の中の反射の理解という点では、Cing 1.6もすでにとても優れています。他のビデオジェネレーターはこれをうまく処理できません。
次のプロンプトは「ステージでピルエットを行うバレエダンサー」です。結果を見てみましょう。
結果が出ました。実際にパフォーマンス全体が非常に良好で、とてもリアルに見えます。私はバレエについて全く知識がないので、実際にピルエットとは何かを検索する必要がありました。定義によると、ピルエットとは「片足で回転する動作で、通常は上げた足が支持脚の膝に触れている」とのことです。
Cingの生成結果を見ると、彼女が回転しているかどうかはよくわかりません。V2の生成結果をお見せしますが、こちらでも彼女が回転しているかどうかはわかりません。私にはわかりませんが、どちらも非常に接近した勝負だと思います。両方の生成結果でバレエダンサーをとてもうまく生成できていますが、どちらもピルエットの回転はできていないようです。コメント欄でどちらが好みか教えてください。
これで他の主要なビデオジェネレーターとのテキストからビデオの比較は終わりですが、できることはまだあります。Cing 1.6で使用できる画像からビデオの機能についても見ていきましょう。
ここで画像をアップロードして、ビデオの開始フレームまたは終了フレームとして使用できます。例えば、このミーム画像を開始フレームとしてアップロードし、さらにプロンプトを入力して方向性を示すこともできます。今回は空欄のままにしておき、このビデオでテストしている1.6を選択していることを確認します。そして、より品質の良いプロフェッショナルモードを選択して生成します。
結果が出ました。この生成で最も印象的なのは、ビデオ全体を通して顔の一貫性を本当によく保っていることです。男性も女性も、ミーム画像の中の男性と女性そっくりです。これは本当に印象的です。
参考までに、MinimaxとCing 1.5で同じ生成を試した結果をお見せします。Cing 1.6の方が若干品質が良く、顔の一貫性も良好だと思いますが、コメント欄で皆さんの意見を聞かせてください。
これはかなり退屈なビデオでした。喧嘩をすると予想していたのですが、喧嘩はしていません。そこで代わりに、このプロンプト欄に「3人のキャラクターが喧嘩をする」と書いて、もう一度生成してみましょう。
結果が出ました。とても礼儀正しい口論をしているように見えます。拳で殴り合うような喧嘩は起きていません。かなり期待外れですね。
次は、このフレームを消して別のものを試してみましょう。大きな目のペア...はい、目ですよ...を持つこのアニメの女の子の画像をアップロードします。明らかに目のことを言っていたのに、何を考えていたんですか？プロンプトには「話すアニメの女の子」と書いて、これができるか見てみましょう。
結果が出ました。これは本当に印象的です。アニメの女の子のように実際に話していて、手や指も正しく見え、全てが非常に一貫しています。特にMinimaxとCingと比較すると、Minimaxは彼女が話すと不気味な感じになり、旧バージョンのCingでは彼女を話させることさえできません。このようなアニメ写真をアニメーション化したい場合、現時点ではCing 1.6が最良の選択肢のようです。
次は、このプロンプトとこの画像を消して、ゾンビに襲われる女性の画像をアップロードします。プロンプトには「恐怖の表情を浮かべた若い女性、後ろからゾンビに襲われている」と書きましょう。結果を見てみます。
結果が出ました。全てが非常に鮮明で詳細で一貫性があり、とてもリアルに見えます。MinimaxとCingの旧バージョンと比較すると、あまり大きな違いはないと思います。Cing 1.6は品質が高く、Minimaxはこの女性をより恐怖に駆られた表情にしていますが、より多くの不一致も見られます。コメント欄でどちらが好みか教えてください。
次は、T-Rexに追いかけられる女の子の画像をアップロードします。プロンプトには「T-Rexから逃げ惑う恐怖に駆られた女の子」と書きます。
結果が出ました。少なくともこのクリップの最初の部分では、彼女はT-Rexから逃げています。そして、彼女の顔の一貫性を保っている点に注目してください。
比較のために、MinimaxとCingの旧バージョンで同じ生成を試した結果をお見せします。大きな違いはありませんが、1.6では再び女の子の顔がより一貫しており、若干細部の品質が高いことに注目してください。
これでCing 1.6のレビューとテストは終わりです。他のトップAIモデルと比較して、どれだけ良いか悪いかの感覚を掴んでいただけたと思います。これらの例から、現時点ではまだ使用できないV2を除いて、明確な勝者はいないと思います。Minimax、Hunanを含め、全て非常に似ています。生成したいものによって異なるので、残念ながら現時点では、3つのビデオジェネレーターすべてをテストして、その中から最良の結果を選ぶのが最適な選択肢だと思います。
コメント欄でこれらについてどう思うか教えてください。いつものように、トップAIニュースとツールを皆さんと共有できるよう注目し続けます。このビデオが良かったと思ったら、いいね、シェア、購読をお願いします。次回のコンテンツもお楽しみに。
また、AIの世界では毎週とても多くのことが起きているので、YouTubeチャンネルですべてをカバーすることは不可能です。AIで起きているすべてのことを本当に把握するために、無料の週刊ニュースレターを購読してください。リンクは説明欄に記載しています。視聴ありがとうございました。次回の動画でお会いしましょう。

今すぐ使える最高のAIビデオジェネレーター

いいなと思ったら応援しよう！