生成AIで音楽はどうなるのか / AIではたどり着けない音楽の神髄とは
2024年は画像生成AIが飛躍的な進化を遂げた年でした。画像・映像面だとクリエイティブの現場に生成AIがどんどん導入されていくでしょう。制作工程が変わっていく。
次いで、音楽です。音楽生成AIもSuno.aiを筆頭に「聞けるレベルの曲」が生成されるようになってきました。譜面を読ませて曲を作るとか、特定のアレンジを行うとこはまだ未発達なものの、もっと制御できるようになれば制作現場に使われるようになるでしょう。こちらもあと1-2年か。
2019年、こんな記事を読みました。
ビリオネアでベンチャーキャピタリストのビノッド・コースラ氏は、今後10年で音楽を聴く人はいなくなり、代わりにユーザーの気分に合わせて作られたカスタムソングのようなものを聴くようになると考えている。
そうした音楽は、AIテクノロジーによって作られるだろうと同氏は述べた。
例えば、すでに特定のアーティストやバンドを選んで聴くよりも、スポティファイが提供する気分に合わせたプレイリストを聴くユーザーもいる。
とのこと。これ、Suno.aiでできあがった曲とか聞いていると分かる気がします。けっこう面白いものができてくるし、自分が作った感もある。現在は音質が悪いけれど(なんだか輪郭がぼやけている)、もっとクリアになっていくと「どんどん好きな感じの音が生成される」ならわざわざ他の音楽を探そうとしなくなるのはわかる。
多分、それでも「僕は」アーティストが作った音楽を聴き続けるでしょう。他にも、このブログの読者の方はそう思う方が多い気もする。なぜならそもそも「音楽好き」だから。基本的に音楽好きな人じゃないと音楽ブログを読みません。だけれど、前に「メタルアーティストがなぜ高齢化しているのか」でも書いたように、「私たちの世代は思っている以上に私たちだけのものなのだ」と思っています。「音楽の聴き方」も10年、20年たてば変わる。「好きなアーティストがいて、ニューアルバムを楽しみにして、アルバム単位で曲を聞く」というのも世代に紐づいた体験だし、「ストリーミングでザッピングする」というのも世代に紐づいた体験。それなら「生成AIで音楽を流し続ける」世代だって出てきてもなんの不思議もない。たぶん、僕は自分の所属する世代に紐づいた体験をずっと続けていくんですよ。今を生きているからいろいろと変化を試すけれど、最後には自分が慣れ親しんだものに戻る、追憶する。それが自分のアイデンティティだから。
ひと世代違うとまったく消費行動や文化が変わることがある。すべてが変わるわけではありませんが、音楽というのは世代によって付き合い方が大きく変わりやすい文化です。特に、音楽は技術革新の影響を受けやすい。
そもそも、近代で僕が知る限り音楽家に一番影響を与えたのは「録音技術の発明」です。昔はすべての劇場、映画館、ラジオ局に「お抱えの楽団」がいた。録音物がないから音はすべてその場で演奏したんですよね。1920年代まで無声映画が普及していた。台詞というか場面の説明をする「活動弁士(活弁士)」なる職業もありました。ただ、レコードが普及し、映画もトーキー映画(音入り)にだんだんと1930年代に変化していく。ラジオも初期(1920年代まで)は生演奏だった。それが録音物に変わっていくにつれてお抱え楽団は仕事を失います。この時は全米音楽家協会がストライキをやってさんざんもめた。結果として著作権の中の「演奏権」とか、録音物を再生するたびに音楽家にもお金が入る仕組みが確立されていくわけです。他にも、レコードからCDへ、CDからストリーミングへ、フォーマットや流通が変わる都度起きてきた旧譜の再発掘。サウンド面でも小型アンプから大型アンプ、近代音響技術の確立によるコンサート会場の巨大化。楽器や録音機材、シンセサイザーやマルチトラックの発達による音楽そのものの変化など、無数の変化を起こしている。そのあたりの変化の歴史は下記の本に詳しいです。
なので、大枠としては「やがて生成AIで作った音楽を主に聞く世代が生まれるだろうし、音楽制作や音楽家の在り方は技術によって変化していくものだ」と僕は思っています。
ただ、「音楽のすべて」が生成AIに代替するとも当然ながら思っていません。これはAI論にもなりますが、人間にしかできないというか、「仮にAIなり機械で代替しようとするととてつもない手間がかかる(わりに、人間なら個人でできる)=機械化する合理性がない」分野があります。少なくとも今後数十年、いや数百年は「人間にしか出せないだろう」と思うのは、まずライブですね。「ライブの興奮」というのは当然、身体がないとできないし、みんなで集うことの身体的共時性、陶酔感があるわけでこれは「人が集まらないとできない」。ライブの中でももっとも興奮度が高いと思うのは宗教音楽ですね。音楽による酩酊、法悦。儀式音楽。いくつか例を出しましょう。まずはフィクション、映画「ブルースブラザース」で描かれた「宗教音楽(ミサ)の盛り上がり」、映画なので大げさでわかりやすいですが、実際にハーレムのミサに行くと近い光景が繰り広げられたりします。
神父がジェームスブラウンですね。演奏しているのはジェームスブラウンのバンド。当時最高峰のファンクバンドとファンクボーカルです。また、バックコーラスで若いころのウーピーゴールドバーグ(天使にラブソングを)の姿が見えます。ディフォルメされていますが演奏は本物。
実際の宗教音楽でめちゃくちゃ盛り上がっていると思う映像はこちら。やはり映像だと限界がありますが、この場の陶酔感は推測できます。
パキスタンの宗教音楽「カッワーリー」の歌手で「神の声」と言われたヌスラット=ファト=アリ=カーンの絶唱。強いボーカルに率いられ、コールアンドレスポンスで演奏者も観客もだんだんとトランス状態に入っていきます。音楽、リズムに参加することで没入していき、ゾーンに入る。こうした経験こそがライブの真骨頂だと思っています。
インドネシア、バリのケチャも凄いですね。
演奏者が完全にトランスに入ります。これ、どういう仕組みかと言うと真ん中に車座で座っているひとたちがそれぞれ自分の後ろの楽隊のリーダーで、各参加者は前の人に従っている。円が大きくいくつかのグループに区切られていて、それらがリーダーに従って違うリズムを奏でるので複雑なポリリズムが生まれます。五線紙で区切られた、あるいは機械(シンセやメトロノーム)で制御された「時間を均一な拍子に区切る」わけではなく、身体的な共時性に基づいて、演奏者が互いを見ながら演奏していく。本質的にはオーケストラも同じですね。今のバンドはモニターでクリックを鳴らし、クリックに合わせて演奏することが多い(ステージ上だとアンプで増幅されすぎて互いの音が聞こえないため)ですが、生音同士のやり取りだとこうした「音によるコミュニケーション」が生まれます。そしてこれによってより深く没入していく。
インドネシア音楽はケチャに限らず同じような、「リーダーがいて、リーダー同士で間合いを図って、リーダーに従って複数人が演奏する」という形式が多いですね。ガムランもそうです。
ガムランのパートのリーダーは真ん中の人、前のドラムのリーダーはその右手前の人ですね。各メンバーはリーダーに合わせている。でもこれ、かなり演奏が早いですよね。もともと、日本の雅楽もかなり早かった説があります。いつのまにかだいぶゆっくりになっていますが、江戸時代とか平安時代はめちゃくちゃ早かった。あと、平均律チューニングでもないので、このガムランのような独特な響き、且つ、高速ユニゾンプレイだった気がします。鼓、笛も同じですね。メロディ楽器が琴(弦楽器)かガムラン(打楽器)かの違いはありますが。昔の雅楽はこんな感じだったのかも。これは聞くより、演奏側がトランスに入る音楽ですね。トランスに入るぐらい集中しないとここまで息がそろわない。多人数が同期した高速技巧というのはトランス的な要素が多いです。あとはコーラス、歌は呼吸を一致させないといけないので一体感が増すし、息を吐きだし続ける(=声を出す)ことで軽い酸欠状態になり酩酊する。
個人的に、ケチャも観に行ったことがあるんですが(今はバリで週〇回、観光ツアーみたいな感じでやっている)、そこだと人数も少なくてあまり酩酊感はありませんでした(こんな感じ)。残念。ハワイのフラとか、バリのケチャとか、モンゴルのホーメイとか一通り見ていますが、どれもいい思い出と忘れらない体験ではあるもの、ライブの神髄たるトランスまでは至らない。
個人的にけっこう「飛んだなぁ」と思うライブはこのバンドでしたね。
渋谷サイクロンで見たSuffocation。急に音楽ジャンルが変わりますが、これすごく酩酊的だったんですよ。一定のビートがずっと続くし、ボーカルもちょうどいい低音でしょ。かつ、テンポが速い。なんだかどんどんどんどん酩酊していく。他にもデスメタルはいくつか見たことがありますが、今までのところSuffocationの酩酊具合は段違いでしたね。
あと、いわゆる「クラブミュージック」。あれでトランスするのは長時間の耐久が必須な気がします。酒も入り、ずっと踊っていると体力的に疲労してくる。判断力が鈍くなる。一度、徹夜明けでフジロックに行ったことがあって、その時のヘッドライナーのBjorkは飛びました。音が見えた。共感覚というそうですが、要は徹夜ハイですね。ランナーズハイと同じ。脳内自家麻薬が出るので、覚醒した状態になります。比喩じゃなく本当に脳科学的な話。エンドルフィンとかアルファドーパミンとかアドレナリンとか、具体的な状況までは脳波図ってないのでわかりませんが、そういう物質が出ているといわゆる「トリップ」します。薬物に頼らず、肉体的疲労や呼吸によってそうした状態にはなる。
Bjorkは2003年か。これ、徹夜明けで行った上に、メインステージで山崎まさよしが出たんですよね。嫌いじゃないけど、オールスタンディングで徹夜明け夕方から見るのはきつかった。確か雨も降ってきたはず。その後プライマルスクリームでちょっと温まるも、Bjorkは機材トラブルか何かで1時間近く遅れたはず。ずっと立っていて、Bjork始まったときには立ちながら意識が落ちる状態。下はぬかるみ、周りは人だかり。その中で立ち寝。立ちながら寝たのはこの時が人生初でした。で、最初のうちはもうろうとしていたのだけれど、途中、Jogaか何かでステージに花火(パイロ)が上がった。ここで急にバキバキに覚醒したのを覚えています。音が見えるようになった。神秘体験的な本当の話笑。
まぁ、これは「音楽体験」というか、「極限状態において音楽が果たす役割」的な話ですが。戦場の音楽とかもそうした劇的な効果をもたらすのかもなぁ。肉体的に極限だろうから。
あと、単純ですが自分で演奏するとけっこう酩酊します。弾き語りってのは酩酊しやすい。生音だし、ギターとボーカルと両方を同期させる必要があるし、声も出し続けるから呼吸が強く循環するし、それでジャムセッションとかやるとさらに音のコミュニケーションが生まれるし。やったことがないけれど、ジャズもおそらくそうなんでしょう。
こうした「音楽に参加してトランスする」という体験は生成AIでは無理でしょうね。ライブに行ってトランスしよう!(強引)
それでは良いミュージックライフを。