
【実践解説】動画生成AIの常識が変わる!「Vidu 1.5」のマルチ参照機能とは?
こんにちは!AI-Bridge Labのこばです!👋
最近は動画生成AIを使って大手企業がCMを制作したり、アニメやドラマなどの映像コンテンツにもAIが活用されつつあります。
今回は、そんな中でも特にアニメ系の動画生成に強いことで注目を集めている「Vidu 1.5」について、従来の動画生成AIとどこが違うのか、実際の使用例を交えながら詳しくご紹介していきます!
Viduを使えばこんな動画が誰でも簡単に作れるようになります
Vidu 1.5のマルチエンティティを使ってアニメシーンを作成してみました
— こば@AIBridge Lab (@doerstokyo342) November 13, 2024
投入した画像は登場人物A,B,背景という3枚構成です
崩れもありますが、複数のキャラを同時に、共通の背景で動画化するアプローチとしてかなり有望な手段だと感じました#AI動画 #AIアニメ
投入した画像はリプ欄 pic.twitter.com/OSHVAwUrnF
1. Vidu 1.5とは?
Viduは、生数科技(Shengshu Technology)が開発した最新の動画生成AIプラットフォームです。特に注目すべきはv1.5のアップデートと共に追加された「Multiple-Entity Consistency(多主体一貫性)」という新機能で、これによって以下のような革新的な性能を実現しています。
たった1-3枚の参照画像で高品質な動画生成が可能
高速な生成速度(4秒動画なら1分程度)
人物の見えていない部分の補完や一貫性を保ったまま自然な動きを実現
2. 主な機能と特徴
2-1. 技術的な革新点
Vidu 1.5には、3つの重要な技術的ブレークスルーがあります。
1.複雑な主体の精密制御

アニメーションキャラクターの正確な制御(特に3Dアニメ)ができます。
あらゆる角度からの一貫性を維持できるので、キャラが回転したりしても崩れることが少ないです。
また、小物や模様など細部までこだわった正確な再現も可能です。
2.自然な表情と動きの実現
Midjourneyで生成した三面図からVidu 1.5で動画を生成するテスト
— こば@AIBridge Lab (@doerstokyo342) November 13, 2024
一貫性のある三面図を投入すると崩れも少ないですね
プロンプトは以下
young anime maid character in navy blue dress and white apron, gentle spinning motion while standing, detailed Victorian-style costume with floral… pic.twitter.com/hiYywhYPas
キャラクターの特徴を維持しつつ、自然な表情の変化やスムーズな動作を実現しています。
3.複数要素の相互作用

複数キャラクターを登場させたときでも、互いに自然な関係性を持ち、背景との違和感のない統合も可能です。
2-2. 生成フロー

上記のフローの通り、Vidu 1.5での動画生成は非常にシンプルです。参照画像を複数アップロードし、プロンプトを入力するだけで、あとは生成ボタンを押すだけで自動的に動画が生成されます。
3. 実際の使い方
以下は、実際の使用方法です!公式サイトからGoogleアカウントなどで登録が可能です。ログインができたらCreate VideoからReference to Videoの項目に行けばこの機能が利用できます。
STEP1: 参照画像の準備

使用したいキャラクターの画像を1-3枚用意
これは複数のキャラクターの組み合わせでも良いですし、同じキャラクターの三面図のようなものでも良いです。ソロシーンであれば同じキャラクターの画像を、キャラクター同士の掛け合いなどのシーンを作りたければ複数のキャラクター画像を投入するなどケースによって使い分けると良いです。できるだけ特徴がわかる角度の画像を選択
例えば正面からの全身画像かつ白背景等、キャラクターの特徴がはっきりと伝わる画像が理想ですが、シーンに合わせて必要な部分が映っている画像があれば問題ありません。
STEP2: プロンプトの入力
キャラクターの特徴は画像から学習されるので、細かく特徴を伝える必要はありません。女性の人物なら「1girl」や「1woman」など、登場人物の説明と、その動き、環境などを指定しておきます。
Vidu公式のプロンプトガイドも参照するとよりクオリティを上げることができると思います。
今回は例として以下のように入れてみました
young Asian woman in flowing cream blouse and 3D anime boy with glasses in grey hoodie, walking and interacting naturally, whimsical playground setting with swings and slides, mixed-media composition blending live action, 3D animation and crayon art style backgrounds, medium tracking shot with subtle dolly movement, soft natural lighting with rim light on characters, seamless style transition effects between realistic and animated elements, pastel color palette with mint green sky and flowing clouds, hand-drawn heart particles floating occasionally, cinematic depth of field, gentle ambient motion in background elements, smooth camera movement at eye level, hybrid rendering combining photorealism, anime shading and crayon texture overlays
STEP3:オプションを設定する
Duration(尺)
動画の尺は4秒と、8秒から選べます。8秒は4秒よりも多くのクレジットを消費します。Resolution(解像度)
Speed,720p,1080pの中から選択できます。解像度が高いほど多くのクレジットを消費します。Movement Amplitude(動きの大きさ)
Auto,small,Medium,Largeの中から選択できます。Largeはよりダイナミックな動き、Smallは静的な動画になります。アクションシーンではLargeかMediumを選び、会話シーンなどはSmallが良いと思います。ただし、動きが大きい場合は崩れやすくもなるので注意が必要です。Aspect retio(アスペクト比)
16:9,9:16,1:1の中から選択できます。
STEP4:生成された動画を確認
動画が生成されると、プレビューやダウンロードが可能です

料金プラン
最新の料金プランは以下のページから参照して下さい。無料プランでも80クレジットが付与され、ある程度は生成が可能です。
4. 機能の革新性について
これまでお伝えしてきた通りVidu 1.5の最大の特徴は「Multiple-Entity Consistency(マルチエンティティ一貫性)機能」です。
具体的には、従来の動画生成AIのアプローチと比較すると以下のような違いがあります。

Vidu 1.5を使えば以下のようにあらゆることに活用が可能ですが、明確な制限事項(弱点)もあります。

このように、Vidu 1.5は単体で完璧な動画を生成するより、効率的な動画制作のための強力な「土台」としても活用できます。他のAIツールと組み合わせることで、さらに可能性が広がるでしょう。
まとめ
Vidu 1.5の新機能は、単に動きの品質の向上だけでなく動画生成AIの進化の方向性新しいアプローチを取り入れた革新的なツールと言えます。
今後のアップデートでさらなる進化が期待される本ツール。みなさんもぜひ、新しい表現の可能性を探ってみてはいかがでしょうか?
最後まで読んでいただき、ありがとうございました!
AI-Bridge Labについて
AI-Bridge Labは、最新のAI技術とその活用方法について情報を発信し、企業のDX実現をサポートしています。AIを活用したソリューションや人材育成にご興味があれば、お気軽にご連絡ください!
Vidu 1.5のマルチ参照機能の登場でキャラ三面図+プロンプトからあらゆるシーンに対応可能になりました
— こば@AIBridge Lab (@doerstokyo342) November 13, 2024
生成された全フレームをStable DiffusionやFluxなどで自動的にリファインするワークフローが組めたら見栄えもかなり良くなりそうですね#ViduAI pic.twitter.com/YkH0MG7bP3
いいなと思ったら応援しよう!
