
動画生成AI Soraに出てくる人間は何故アンドロイドなのか
タイトルにも書きましたが、動画生成AIで作成される人間は人間味が薄いというか、アンドロイドぽい感じの仕上がりが多いと思います。それは何故なのか、何故そのように感じるのかを考えてみたいと思います。
不気味の谷現象
動画生成AIによって作られる人間の映像を見たとき、「少しアンドロイドっぽいかな」と軽く感じるだけで済むのは、多くの場合、私たちがその技術を理解している立場にいるからではないでしょうか。開発に携わっていたり、AIに親しみを持っていたりすると、多少の不自然さが気にならなくなり、むしろ「ここまでリアルに作れるんだ」とポジティブに受け取れることもあります。
しかし、そうしたAI技術に慣れていない人々が同じ映像を目にすると、印象は大きく変わります。彼らは「なんだか人間に似ているけど、これは人間じゃないよね」といった違和感を強く覚え、不気味さを感じるかもしれません。この感覚は、私たちが本能的に「人間とはこうあるべき」という基準を持っているため、微妙にズレた部分が目立ちやすいからです。
こうした現象は「不気味の谷現象」と呼ばれます。特に、人間に非常に近い存在が微妙に不自然だと感じたとき、その不気味さが一層際立つという心理的な反応です。たとえば、人間そっくりに作られたアンドロイドやCGキャラクターに対して、完全な人間と同じリアルさを期待してしまうと、少しでも不自然な動きや表情に気づいた瞬間、そのわずかなズレがとても気持ち悪く感じられるのです。
逆に、人間とかけ離れたデザインのロボットやキャラクターは、最初から「非現実的な存在」として認識されるため、違和感や不気味さをあまり感じません。このように、似ているからこそ強調される気味悪さが、不気味の谷現象の本質なのです。
動画生成AIの人間に何が足りないのか
それを考える前に、こちらの動画を見てください。
(とりあえず、分かりやすい動画がこれしかなかった)
こちらは有名なアンドロイドのお姉さんについての動画です。実際には、人間が自分の動作を意図的に減らしてアンドロイドらしさを再現しています。しかし、これによって逆に人間が不気味に見えるという現象が起きるのは、とても興味深い点です。ということは、アンドロイドのお姉さんが減らした動作要素を逆に動画生成AIの人間に加えることで、より自然な人間らしさを表現できるのではないかと考えています。
これを別の例で説明するなら、ロボットダンスがわかりやすいでしょう。上手なロボットダンスは、動きから人間らしさが完全に消えているため、機械的な美しさが際立ちます。しかし、下手なロボットダンスは動きに人間的な癖が残っているため、「ロボットらしさ」が表現できず、逆に人間臭さが目立ってしまいます。つまり、上手なロボットダンスは、通常の人間の動作の枠を超えた動きを実現しているのです。
その違いを考えると、ロボットは動作のベクトル、タイミング、強さを正確に制御できますが、普通の人間は動作に微妙なブレが生じ、完璧にコントロールすることはできません。この「ブレ」が人間らしさの特徴とも言えるのではないでしょうか。
動画生成AIに目を向けると、生成される映像はすべて計算に基づいて作られているため、特別な指示をしない限り、人間らしい「ブレ」を表現することが難しいように思います。もしこの「ブレ」が人間らしさの正体だとすれば、それを意図的に導入することで、よりリアルな人間らしさを再現できる可能性があります。
実際、先日試した動画では、視線や動作に揺らぎを加えるよう指示を出してみました。正直なところ、これだけで完璧に人間らしさを表現できたとは言えませんが、以前よりも自然な印象が出たと感じました。ただ、この変更がどれほど効果を上げているのか、そして何がまだ足りないのかをしっかり検証するためには、さらなる試行錯誤が必要です。しかし、試そうにも私のクレジットは尽きてしまいましたので、良かったら皆さんもこの方法を試してみていただければと思います。