見出し画像

デジタルミュージックと"シンギュラリティ"

まず、このMVを見てほしい。world's end girlfriend「RENDERING THE SOUL」という楽曲である。リリース文ではこのような表現がされている。

シンギュラリティ後にAI自身が楽しむ音楽はどんなものだろう? 人間には理解できない/処理できない音楽になるだろう。 その中で人間が理解できる/面白がれる音楽が在るとしたら 『AIが人間の不完全さや非合理性を面白がり、人間が持つ孤独や苦悩や悲哀などを 「感情のコスプレ」として真似して遊んでる音楽』 かもしれない。 というコンセプト(妄想)で今作は制作された。

world's end girlfriendは元々、ポストロックやエレクトロニカというジャンルの枠を飛び越えて、時に現代音楽的な実験要素を出してきたが、今作はボーカルにボーカロイドを使用することで、作品のコンセプトをより際立たせた。

シンギュラリティ=技術的特異点、人工知能が人間の頭脳を越えるのは2045年と言われている。人間が作ったものをなぞらうのではなく、人工知能自身が音楽を奏でる時代が来た時にどうやって、どんな音楽が生成されるのかということだ。

 

【AIとアートの今】

絵画の世界では、ディープラーニングによる著名な芸術家の作風に置き換えるという実験は既に行われている。

画像を加工するだけではなく、絵の具のタッチなども全て解析した上で、レンブラントの作品を完全に新しく生成するというこちらの作品も非常に面白い。

つまり、シンギュラリティを迎える20年前にも関わらず、既にAIは蓄積されたデータが存在していれば、その人物の特徴を捉えながら代替することが出来るという状況に入っている、ということになる

音楽で見た時に数日前から話題になっているのは、美空ひばりの歌声をボーカロイドの技術で再現するだけではなく、なんとこの声を使って新曲が披露されるという事だ。新曲は秋元康のプロデュースであり、まさにお嬢が再び現れたということになるかもしれない。

ヤマハにとってこの作業は初めての作業ではない。2014年にhideの未発表曲『子ギャル』のボーカル部分を制作している。この曲は既に歌詞もバンド演奏も完成していたものの、ボーカルレコーディングがされていなかった曲だったが、今までのレコーディングデータから必要な情報を集めてエディットされた。

通常、ボーカロイドの元になる音声のレコーディングは通常の曲を歌うようなものとは違い、ある音の高さから伸びた時にどのような性質を持つ波形になるかなどかなり特殊なレコーディングとなり、おおよそ全てのデータを取るのに3日ほどかかると言われている。しかし、hideの新曲は既存楽曲などからデータ抽出するという異なるアプローチを行ったため、2年という月日がかかった。

その後、小林幸子をボーカロイド化したSachikoなどをリリースしており、ポップスやロックだけではなく、演歌などの特徴的な歌唱法に関してもヤマハの中の知見が高まった中での美空ひばりの新曲、なのだ。

 

【ギターアンプを再現するアンプKemper】

現在、音楽の制作環境の多くはソフトウェア化されており、コンピューターの中だけで完成させることも一般化してきた。その中で特別な驚きを生んだのがこのシステムだった。

Kemper Profiling Amplifierである。存在するギターアンプのニュアンスだけをモデリングするのではなく、個体の特性やマイク位置までを含めた実際の鳴りをプロファイリングし、インターネットで公開されている専用データを自由に導入することが出来るシステムである。

ギターアンプという存在は、人間が弾くアナログの入力を電気信号に置き換えてアウトプットをする上での一番分かりやすい形と言える。これまでの歴史で更新されてきた様々なアンプの特性をデータに置き換えたという意味で、AIもまた新たな情報を得たと言える。 

先日、ローランドから発表されたばかりの新作シンセサイザーJUPITER-Xはアナログ・シンセからデジタル・シンセまで人気のシンセサイザーの音色を再現出来るだけではない驚くべき機能が搭載されている。

なんと温度センサーが搭載されており、電源投入から時間が経過する事により本体の温度によって音が変わるアナログシンセ特性までシュミレーションするというのだ。つまりこれもまたデータ化された音の情報と言える。

 

【AIによる作曲、作詞】

古くで言えば、シンガーソングライターに搭載されていたコード進行からアレンジを自動で生成する機能はあったが、すでにAIが作曲をするという段階に入っている。

上記記事の中に出てくるFlow Machinesという人工知能ソフトを使い、生成されたメロディに、人間が歌詞や編曲をつけて完成されたアルバムも既にリリースされているのだ。

AIによる作詞ではMaison book girlを手掛けるサクライケンタがこれまで書いた詩をディープラーニングさせることで生成した言葉から作成するという共同作業を行っている。

元々現代音楽的なアプローチを行ってきたグループだが、これまでの作品とは異なり、言葉と言葉の前後に繋がりが感じられないなどAIならではの違和感が見える。

AIによる作詞というのは、世界的にも様々な場所で行われているのだが、唐突に作られた言葉の面白さはあれど、作品としての完成度という意味ではまだそこまで高くなっていない技術なのだ。

ただし、マイクロソフトが7月に行った講演で本人の音声をシュミレートして、全く別な言語を同時通訳する技術を見せた。

特に驚くべきなのは、これが日本語で通訳をされたという点だ。日本語の翻訳というのは、実は他の言語に比べても非常に複雑だと言われており、文脈を読むということが難しいという。それを違和感なく、同時に生成するということは、作詞をさせた際の違和感も改善していく可能性は大いにあると言えるだろう。

 

【人の形をしたボーカロイドとバーチャルYoutuber】

ボーカロイドを知らない人がその存在を前にした時に、機械で生成された音声の何が面白いのかという壁にぶつかる。それはある意味で、シンギュラリティの手前、人間が理解出来ない人工知能の知性に対しての疑問に近い。

しかし、現実にボーカロイドは幅広い層、国を飛び越えて愛される存在となった。単純にアニメ的な様相や人間では歌えないような早口や音域というレベルではすでに無い。

ボーカロイドを使って作られた曲の中でも特徴的な『ECHO』はアメリカ在住のクリエイターCrusherPによって作成された。言語やメロディなど人間に感情を呼び起こさせる要素が人間を越えたAIによって生み出された時に、それは人間の模倣なのか、AIでなければ理解の出来ない音なのかの淵にいるということだろう。

バーチャルYoutuberは外見は人の形をしているが、中の人がいるという構造である。例えるなら、アニメにおけるキャラソン(キャラクターになりきって声優が歌う歌)に近いかもしれないが、声優本人と切り離されたキャラクターという存在は実在しないにも関わらず、受け入れられている。

バーチャルYoutuberの中で、実際にアルバムをリリースしたり、ライブを行うというのは一般化しつつある。作られた楽曲は一般的な行程で作られ、レコーディングをされるわけだが、ライブでは初音ミクのライブのように擬似的に3D化された映像をリアルタイムに操作しながら歌う形となり、演者と観客は別な空間に存在している。まだ観客の側が3D空間に入るというのは一般的ではないものの、試みは行われている。

また外見の要素や歌という概念を溶かす存在としてバーチャルYoutuberでありながら、ポエムコアというジャンルを投稿するミソシタもデジタルとアナログの狭間の表現という意味で面白い。

 

ありとあらゆる音がデジタルに変換され、デジタルによって生み出された音の向こう側にシンギュラリティが待ち構えている。それは1つずつ蓄積されたデータとなって、ディープラーニングの向こう側へと送り込まれている。もはやデジタルは人間にとって手放せないし、AIによって生活が変化していることは免れない。

どんどんとAIが進化する中で、人間の利便性や快適さ、喜びのようなものを追求していった時にそこで生成された音楽はどのような形になっているのだろう。

そこにこの『Absolute Ego Dance』の揺らぎは存在するのだろうか。

いいなと思ったら応援しよう!