静止画から動画生成〜Hailuo AIがすごい
お久しぶりです!南の島に逃避行していたこともあり、1週間以上ぶりの記事です。
久々の記事の題材に選んだのは、数週間前にSNS上で話題になっていた動画生成AIのHailuo AI。流行からは完全に乗り遅れてしまいましたが、話題通りのハイクオリティな動画を静止画から生成できました。この手の技術は今後、様々な業界にインパクトを与えそうです。
Hailuo AIについて
Hailuo AIは中国のAI企業であるMiniMaxによって2024年9月にリリースされました。テキストから6秒の動画を生成できるだけではなく、静止画から動画を生成することができます。SNSでは静止画から生成される動画のクオリティが話題になっていました。
若干、人間の出てるシーンに破綻は見られるようですが、全体的には破綻を感じづらい動画になっています。
次はライブ風の静止画からライブ動画を作っている例を紹介します。
細かい点を見ると顔のあたり等がおかしく見えなくもないし、別人に変化しているようにも見えなくもないです。しかし、静止画を提供しただけで全体に破綻を感じづらい動画を作れるのはすごいと感じました。
Hailuo AIのプライバシーポリシー
すごそうな感じはありますが、AIといえば気になるのはプライバシーの取り扱い。その点どうなっているのか、プライバシーポリシーを見てみましょう。
この記事を書いている時点では最新版のプライバシーポリシーは2024/9/15版でした。ChatGPTに要約してもらいましょう。
ユーザーのアップロードしたデータが学習に利用されるかどうかについての記載はありませんでした。さらに、子会社や提携会社、サービス提供者との情報共有があるようですが、第三者に提供されたデータがどのように取り扱れるかは不明です。
以下を確認するとGDPR準拠が謳われているため、個人データの保護は確保されていると考えられます。
ただ、具体的にどの程度プライバシー保護がなされているかは明確ではないです。この点については個人の判断での利用となります。
Hailuo AIを実際に使ってみた
プライバシーポリシーに若干の不明点があるので、個人的に問題のないデータで利用してみました。
試しにDALL-E 3で生成した以下の女性の画像を動かしてみましょう。
まずは以下のページにアクセスします。
Googleアカウントなどでログインした後、動かしたい画像をドラッグ・アンド・ドロップでアップロード、必要に応じてプロンプトを入れるだけです。
数分待てば動画の完成です。
なかなかのクオリティです。かなり自然な仕上がりなのではないでしょうか。
次についこの前訪問した南の島の画像を動かしてみましょう。
以下がHailuo AIで生成したビーチの動画です。
かなり自然です。波と雲の動くスピードが現実離れしてしまうのではないかと予測しましたが、現実と同じように雲はほとんど動かず、波はイメージ通り動いています。比較のため、実際に撮影した動画を記載します。
色味が異なっているし、実際の動画は手ブレもあるのでどちらがより現実っぽいか判断が難しいです。逆に言うとそれだけHailuo AIが静止画から生成した動画が自然だと言えるのかもしれません。
所感
正直、人が写った静止画から破綻の少ない動画を作るのはかなり難しいと考えていました。しかし、Hailuo AIの動画は人が写っていても全体の印象としてはかなり破綻を抑えられているように感じます。ほんの1年前は破綻の少ないAIなんて相当先なのだろうなと感じていたのに、今はむしろ積極的に破綻を見つけにいかなければわからないような動画も生成できるようになっています。2025年にはほぼ現実と見分けがつかないようなレベルになっているのかもしれません。そうなると、ネットメディアを中心に大量の動画生成AIによるコンテンツが作られることになりそうです。それを前提にコンテンツを作る側、使う側、消費する側はたち振る舞う必要があるのではないかと感じました。
そういえば、OpenAIのSoraはどうなったのでしょうか。2024年前半の段階でハイクオリティかつ1分という長尺の動画を生成できているようでしたが、いつになったらリリースされるのでしょうか。待ってますよ!
ほぼ、実写にしか見えない。。。
この記事が気に入ったらサポートをしてみませんか?