
Sora実験:20250224 Model in Kyoto
雨上がりの京都の石畳に立つ日本人女性モデル。本日は久々の生成AIのtext to movieを牽引するSoraを実験をすることにした。
プロンプトは「色白」と記述していたが、Soraがスルーして、叶わず。生粋の日本人女性としているけれども、どうも、アジア系という枠で生成している可能性もある。
カメラアングルと動きは、プロンプト通りにはなっていない。「ドローン撮影」として躍動感を出した方が、面白い動画が生成できたかも知れない。
道幅がイメージしたものよりも広くなっているので、全体的なイメージは筆者の頭の中のものとは少々異なる。しかし、人間というものは、「笑顔」でどれだけ印象が変わるのかが、よく分かる動画となった。




▼ChatGPT-4oによる感想
このコラム「Sora実験:20250224 Model in Kyoto」は、生成AI「Sora」を用いたtext to movieの実験についての考察を記しており、AIによる映像生成の可能性や課題を指摘している点が興味深い。
1. AIの出力とプロンプトの齟齬
「色白」と指定したものの、Soraがそれを反映しなかった点や、日本人女性モデルを指定したにもかかわらず「アジア系」として解釈された可能性を示唆している。これは、生成AIが持つバイアスや、学習データの傾向による影響を考えさせるポイントである。生成AIのモデルがどのようにプロンプトを解釈し、どのようなフィルタリングがかかるのかについては、今後の技術改善とユーザーの試行錯誤が必要だと感じる。
2. カメラワークと躍動感
カメラアングルや動きがプロンプト通りにならなかった点について、「ドローン撮影」というアプローチがより効果的だったかもしれないという指摘がある。これは、映像制作において構図やカメラワークが作品の印象に大きく影響を与えることを示唆している。text to movieの精度が向上すれば、指定通りのアングルやダイナミックな動きの実現が可能になるかもしれないが、現時点ではまだ制約があると考えられる。
3. 環境の違いとイメージのズレ
京都の石畳の道幅が想像よりも広く生成された点についても触れられている。これは、生成AIが現実の都市構造や景観をどのように学習・再構築しているのかを考えさせるポイントだ。Soraが現実の京都の街並みを忠実に再現するのではなく、独自の解釈を加えて生成している可能性がある。このような違いが発生することで、ユーザーの期待と出力の間にギャップが生じる点は、AIが持つ「創造性」と「忠実な再現」のバランスに関する課題を示唆している。
4. 人間の印象を変える「笑顔」
最後に、「笑顔」で印象が大きく変わるという点に触れている。これは、AIによる映像生成が単なる背景やディテールの正確性だけでなく、感情表現や人間の印象に与える影響も重要であることを示唆している。AIが生成する映像の中で、どのように人間の表情が表現されるかによって、視聴者に与える印象が大きく変わることが分かる。
総評
このコラムは、生成AI「Sora」のtext to movie技術の実験を通じて、現在のAI映像生成技術の課題と可能性を的確に指摘している。プロンプト通りに出力されない点や、環境の再現性におけるズレ、カメラワークの自由度の限界といった問題点が明確に示されており、今後の技術進化への期待も感じられる。
一方で、「笑顔」が持つ影響に言及することで、映像の技術的な側面だけでなく、視聴者の心理的な受け止め方にも触れている点が興味深い。これは、AIによる映像生成が単なる技術の発展にとどまらず、人間の感情や美的感覚にどのように影響を与えるかを考える重要な視点となる。
この実験は、生成AIの進化を観察しながら、どこまでプロンプトの意図を忠実に再現できるのか、あるいはAIの創造性による新たな表現が生まれるのかを探る貴重な機会となっている。今後のSoraの発展や、より精密な映像生成の実現に向けた改善点を示唆するコラムとして、非常に示唆に富んだ内容であった。
いいなと思ったら応援しよう!
