見出し画像

静止画から動画生成〜Hailuo AIがすごい

お久しぶりです!南の島に逃避行していたこともあり、1週間以上ぶりの記事です。
久々の記事の題材に選んだのは、数週間前にSNS上で話題になっていた動画生成AIのHailuo AI。流行からは完全に乗り遅れてしまいましたが、話題通りのハイクオリティな動画を静止画から生成できました。この手の技術は今後、様々な業界にインパクトを与えそうです。


Hailuo AIについて

Hailuo AIは中国のAI企業であるMiniMaxによって2024年9月にリリースされました。テキストから6秒の動画を生成できるだけではなく、静止画から動画を生成することができます。SNSでは静止画から生成される動画のクオリティが話題になっていました。

若干、人間の出てるシーンに破綻は見られるようですが、全体的には破綻を感じづらい動画になっています。
次はライブ風の静止画からライブ動画を作っている例を紹介します。

細かい点を見ると顔のあたり等がおかしく見えなくもないし、別人に変化しているようにも見えなくもないです。しかし、静止画を提供しただけで全体に破綻を感じづらい動画を作れるのはすごいと感じました。

Hailuo AIのプライバシーポリシー

すごそうな感じはありますが、AIといえば気になるのはプライバシーの取り扱い。その点どうなっているのか、プライバシーポリシーを見てみましょう。

この記事を書いている時点では最新版のプライバシーポリシーは2024/9/15版でした。ChatGPTに要約してもらいましょう。

【要約】
データ収集の範囲
:Hailuo AI Videoは、ユーザーの個人情報をウェブサイトやアプリケーション上で収集します。収集方法には、フォーム入力、使用データ、デバイス情報、IPアドレス、クッキーが含まれます。
対象外のデータ収集:このポリシーは、オフラインや他のウェブサイト、第三者のサービス上でのデータ収集には適用されません。
16歳未満の利用制限:16歳未満の子供からの個人情報収集は意図されておらず、もし収集されていると判明した場合、削除されます。
自動データ収集技術:利用データや機器情報を収集するため、クッキーやウェブビーコンを使用しています。
情報の利用目的:収集された情報は、ウェブサイトの提供やサービスのパーソナライズ、契約履行、変更通知などに使用されます。
第三者との情報共有:子会社や提携会社、契約サポート企業などと情報を共有する場合があり、また法的義務やユーザーの安全の保護のために情報が提供されることもあります。
州別のプライバシー権:米国の一部の州では、ユーザーがデータの確認、修正、削除などの権利を行使できることが明記されています。
ポリシーの変更:プライバシーポリシーの変更は、ウェブサイトで通知され、ユーザーは定期的に確認することが求められます。

【注意点】
16歳未満の利用禁止
:16歳未満の利用者が登録や情報提供を行わないよう注意が必要です。
クッキー管理:ブラウザ設定でクッキーを無効にすると、ウェブサイトの一部機能が制限される可能性があります。
州ごとの権利行使:特定の米国州のユーザーにはプライバシー保護のための権利があるため、該当するユーザーは権利行使の方法を理解しておくべきです。
ポリシー変更の確認:プライバシーポリシーの更新頻度が明記されていないため、定期的に確認する必要があります。
第三者への情報共有:第三者に情報が共有されるケースがあるため、情報提供先に関して理解することが推奨されます。

https://hailuoai.video/doc/privacy-policy.html をChatGPT 4oで要約

ユーザーのアップロードしたデータが学習に利用されるかどうかについての記載はありませんでした。さらに、子会社や提携会社、サービス提供者との情報共有があるようですが、第三者に提供されたデータがどのように取り扱れるかは不明です。
以下を確認するとGDPR準拠が謳われているため、個人データの保護は確保されていると考えられます。

ただ、具体的にどの程度プライバシー保護がなされているかは明確ではないです。この点については個人の判断での利用となります。

Hailuo AIを実際に使ってみた

プライバシーポリシーに若干の不明点があるので、個人的に問題のないデータで利用してみました。
試しにDALL-E 3で生成した以下の女性の画像を動かしてみましょう。

ChatGPT DALL-E 3で生成した女性の画像

まずは以下のページにアクセスします。

Googleアカウントなどでログインした後、動かしたい画像をドラッグ・アンド・ドロップでアップロード、必要に応じてプロンプトを入れるだけです。

Hailuo AIで画像から動画を生成

数分待てば動画の完成です。

なかなかのクオリティです。かなり自然な仕上がりなのではないでしょうか。
次についこの前訪問した南の島の画像を動かしてみましょう。

曇りの与那覇舞浜ビーチ

以下がHailuo AIで生成したビーチの動画です。

かなり自然です。波と雲の動くスピードが現実離れしてしまうのではないかと予測しましたが、現実と同じように雲はほとんど動かず、波はイメージ通り動いています。比較のため、実際に撮影した動画を記載します。

色味が異なっているし、実際の動画は手ブレもあるのでどちらがより現実っぽいか判断が難しいです。逆に言うとそれだけHailuo AIが静止画から生成した動画が自然だと言えるのかもしれません。

所感

正直、人が写った静止画から破綻の少ない動画を作るのはかなり難しいと考えていました。しかし、Hailuo AIの動画は人が写っていても全体の印象としてはかなり破綻を抑えられているように感じます。ほんの1年前は破綻の少ないAIなんて相当先なのだろうなと感じていたのに、今はむしろ積極的に破綻を見つけにいかなければわからないような動画も生成できるようになっています。2025年にはほぼ現実と見分けがつかないようなレベルになっているのかもしれません。そうなると、ネットメディアを中心に大量の動画生成AIによるコンテンツが作られることになりそうです。それを前提にコンテンツを作る側、使う側、消費する側はたち振る舞う必要があるのではないかと感じました。
そういえば、OpenAIのSoraはどうなったのでしょうか。2024年前半の段階でハイクオリティかつ1分という長尺の動画を生成できているようでしたが、いつになったらリリースされるのでしょうか。待ってますよ!

ほぼ、実写にしか見えない。。。

この記事が気に入ったらサポートをしてみませんか?