見出し画像

花火大会のモーフィングビデオ

花火、というと、子供時代から好きだった。そういう方は多い。私は見るのも好きだが、概念としての花火も好きで、例えば「王宮の花火の音楽」(ヘンデル)と聞くと、それだけで気もそぞろになる。

隅田川花火大会の光景の中に東京スカイツリーを配したAI画像を、以前(6月)、何枚か生成していた。その後、ビデオ化が圧倒的に楽になったので、それらを元にモーフィングビデオにしてみたら結構面白いものになった。花火ほど写真撮影すると散文的になり興が削がれるものはないが、花火のビデオ化初体験の果実は、悪くない。これは生成AIアプリの会社であるFLORA社(ニューヨーク)のモーフィング技術が優れているせいであり、私はその恩恵に浴した形である。

このビデオをXに投稿したら(11/21の01:36AMに投稿)、すぐにサウジアラビア、アルゼンチン、ニューヨークから「Amazing」「Fantastic」といったコメントが寄せられたので、たっぷりとアドレナリンが分泌された。このビデオの生成には、4枚の画像を使用している。いずれもDALLE(OpenAI)によってクリエイトし保存してあったものだ。そのうちの2枚を次にお示しする。

この花火の1枚は、いわゆる蛍光体ドット(phosphor dots)技法を適用させ、デジタル印象派風(digital impressionistic)に仕上げて欲しいというリクエストで生成させたものだった。花火、花火の画像だけでは芸がないので、透明なガラス質の画像になってくれていたリンゴの1枚も加えたところ、一瞬、花火大会の映像ストリームに異化効果をもたらしてくれている。このビデオを自分で見直すと、多くのことが再確認できる。ここでは数点だけ記録する。

## 解像度が低い、暗い: 暗いのは、当たり前ではないか。花火大会をやるのは夜なのだから。しかし、ここのモーフィング画像は昼の光景でも、解像度が低く暗めの発色になる特徴がある。これは、モーフィング計算に膨大なリソースを要するせいでもあるが、それでも、明るめの、かつより精細度の高い出力を期待する旨、FLORAのファウンダーにはお伝えしてある。こういったモーフィング画像が、明るい発色で鮮明に出力できるようになると、インパクトが格段に鮮やかなものになるはずだ。その改善後の感嘆の声が今から聞こえるような気がする。

## 東京スカイツリー1本が、(原画3枚に引きずられて)複数のタワーに割れてしまっている: これはモーフィング画像なのだから、多少のワープは致し方ない。消えたり、また生じたり。変幻自在が売りになっている。それでも、スカイツリーならツリーの、それらしきタワーのビデオ内での首尾一貫性を担保するような機能は、あってもいいかもしれない。モーフィングアプリにおける要検討事項になると思う。(難易度は非常に高いものと推定される。)

## 透明リンゴの画像: ご覧いただいたように原画は透明性が高く、リンゴとしての外形をしっかり保っている。種の所在もしっかり見える。静止画(イメージ)では、生成AIは既にここまでのことを達成している。しかしビデオでは、やや外形がデフォルメされ過ぎた。こういった再現された時の歪みも、やがてはぐっと改善されるはず。その時の到来を考えると、ぞくぞくしてくる。

## 再生速度の調整ボタン: 欲しい人が多いものと忖度する。笑 このビデオでは各花火の爆発から消滅までのサイクルが超高速になっているものの、少し緩めの動きで堪能したいというニーズがあるに違いない。速度調節機能がクライアント端末側に付与されることを願う。お仕着せの属性ではなく、ユーザー毎の調節つまみがあってよい。

さて、
映像だけでは興醒めなので、BGMを付加したバージョンも作成してみた。SUNOなどによる楽曲をかませたファイルの初期視聴数の伸びのペースは傾向的に緩やかなものになるが、それなりに楽しめると思う。楽曲生成AIのSUNOは、最近急速に進化している。打ち明けると、今のSUNO3.5は超人気で(さらにV4が使えるようになっている)、待ち時間があまりにも長いので、以前(8月)作りためておいたピカチュウテーマの軽快な曲(Pikachu’s Summer Skate)と、あえて組み合わせてみることにした。花火の祝祭気分とPikachuの楽曲の「pop energetic upbeat」が合わない理由はない。編集には CapCut を用いている。楽曲側の時間に合わせて1分50秒強の音楽ビデオになった。


いいなと思ったら応援しよう!