見出し画像

「将棋女子」を生成AIで作る:プロンプトはどれくらい影響を受けるのか:Hailuo AI Video Generator編

はじめに

このnoteでは、生成AIで「将棋の駒を持つ女子学生」を作ってみる企画を行っています。

一年前までは、こんなに生成AIを活用してコンテンツを作ってみることは想像していなかった未来なのですが、ここまでかなり深堀が進んできていると感じています。今回は、「同じ静止画から同じエンジンで動画を作る時に、プロンプトがどれくらい影響を与えるか」を調査してみます。


使うもの

まず、静止画はいつもどおりImageFXで作ります。今回はいつもの将棋女子から少しシチュエーションを変えて、「男性と対局中」という状況を作ってみました。

編入試験の実施中かな

そして、動画化もいつもどおりHailuo AIを利用します

プロンプト3種

今回は「感想戦」を想定し、以下のようなプロンプトを用意しました。

  1. She stiffens her face as she speaks to the man sitting across from her(彼女は向かいに座っている男に話しかけながら、顔をこわばらせた)

  2. She speaks quietly to the man across from her, a little nervously(彼女は少し緊張しながら、向かいの男性に静かに話しかける)

  3. She quietly spoke a few words to the man across from her(彼女は静かに向かいの男にいくつかの言葉を話した)

将棋の感想戦をご存じの方ならわかると思いますが、基本的には

「いやー、わからない」などと言いながら、お互いに静かに話し合う

ことが多く、相手を立てながら(子供たちだともう少しズケズケ来ることもありますが)進むことが多いかなと感じます。そんなわけで、プロンプトでも「緊張した」「静かな」などの文言を指定しています。

生成結果

生成結果は以下の通りです。

これを見ると、3つ目のプロンプトが成功例と言えるかなと思いますが、一方で

「顔をこわばらせる」「緊張する」などの意図が上手く伝わっていない

とも感じます。生成AI側は「コンテキスト」というものが理解できないので、表現したい描写そのものをなるべく平易な言葉で指定してあげることが重要であると感じました。

おわりに

今回はHailuo AIを使って、将棋女子を生成AIで動画化する際のプロンプトを変えることで、動画にどのような変化が出るかを実験しました。以前にも書いたのですが、

生成AIは「将棋」というものを全く理解せずにこの絵を生成している

という事実を踏まえる必要があります。これは、過去に学習した大量の画像データから、プロンプトに応じて近しい画像を生成しているだけであって、「今二人の人間が向かい合っている状況」や「その下に置かれている茶色系統の色をしたモノ」が何なのかを理解しようとしているわけではないということに注意する必要があります。

これは、人間の「理解」とAIの「出力」で大きく異なるところですが、この辺の「クセ」を理解することで、望み通りの出力を得られる可能性が高まると感じました。次回以降もこの辺をさらに深堀していこうと考えています。

(つづく)


いいなと思ったら応援しよう!

#ヒデ @hideh_hash_845
課金してくれるととても嬉しいです。シェアしてもらっても嬉しいです。「いいね」も嬉しいですし、フォローも嬉しいです。要するに、どんなことでも嬉しいです。

この記事が参加している募集