見出し画像

「将棋の駒を持つ女子学生」を生成AIで作ってみた:Hailuo AI Video Generator編

はじめに

このnoteでは、生成AIで「将棋の駒を持つ女子学生」を作ってみる企画を行っています。

つい一か月前に、LumaAIでかなりクオリティの高い動画を制作できるということがわかったのですが、また新しいサービスが大体の答えが出つつあるようにはなってきていますが、最近の研究課題についていくつか紹介します。


Hailuo AIとは

まず、Hailuo AIについてです。

中国発のHailuo(ハイルオ)は、クオリティの高い動画を簡単に生成できるAIです。
KLINGやViduに続き、静止画を動画に変える「Image to Video」機能が追加されSNS等で話題を呼んでいます。
日本人など、アジア系の人物の顔や表情の特徴を掴むのがうまく、人物の一貫性を自然に保った高品質な動画を生成できる点が特徴です。

https://shift-ai.co.jp/blog/10567/

特に、日本人に関する動画生成が得意のようなので、実際に試してみることにしました。

利用方法は上の記事をご参照ください。私もGoogleアカウントですぐに利用できました。

生成結果

まずは、これまでImageFXで作ってきた静止画をアップロードし、簡単なプロンプトを指定してみました。

出力を見て

第一印象は「良く動くが自然」

でした。これまでも別の動画生成AIで、指や口などを動かすことは試みてきましたが、特に指の部分を自然に動かすのが難しかったと感じています。それに対し、今回のモデルは非常に自然な動きで感動を覚えました。特に、

口の動きを見ると意味ありげに見えたので、VOICEVOXを使って喋らせて

みました。

強者感が出ていて、非常によろしいのではないでしょうか。

課題

当たり前ですが、生成AIは「将棋」というものを知りません。なので、彼女たちの下に置いてある「板」が何なのかも知りません(というか、そもそも「板」という概念も持ち合わせていない)

先ほどの動画を見ると、将棋盤から新たな「駒」のようなものが湧き出しています。これは、

「木の色の板や駒があるところには、別の駒がありがち」というモデル

に従った処理であって、いちいち将棋というゲームの概念を理解して配置しているわけではないのです。これは以前、LumaAIの時に紹介したものと同じ現象です。このようなゲームにおける「自然な動き」をプロンプトでどこまで制御できるかはわかりませんが、この辺が今後の課題になるでしょう。

ここから先は

377字

¥ 100

課金してくれるととても嬉しいです。シェアしてもらっても嬉しいです。「いいね」も嬉しいですし、フォローも嬉しいです。要するに、どんなことでも嬉しいです。