見出し画像

データ分析で分かる音楽の変化『ポピュラー音楽の進化:USA 1960–2010』

データ分析をすると様々なことが分かります。たとえば音楽の聴かれ方がどう変化したか、とか。Spotifyにはデータ分析の専門チームがあり、「どのように音楽が聴かれているのか」を分析した論文を出しています。

「音楽ストリーミングサービスのユーザーのスキップ行動とその音楽構造との関係」と題されたこの論文は、「どんなタイミングで曲がスキップされやすいのか」を調べています。Spotifyは「ユーザーがいつのタイミングでスキップしたか」のデータを取っているのですね。

この論文は「スキップは、ストリーミング時代になって顕著になった聞き方の変化です」からスタートします。確かに、レコードやテープのアナログはスキップしづらい。「頭出し」というのはありましたが、ワンクリックではできなかった。CD(デジタル)になってスキップが一般的になり、ストリーミング時代になってその行動はさらに一般化しています。

「ストリーミングされたすべての曲の4分の1が最初の5秒以内にスキップされ、すべての曲の約半分だけが完全に聴かれます。」

だそう。4分の1が5秒以内でスキップというのは面白いですね。5秒聞くことで「合うか合わないか」を判断しているものもあるでしょう。あるいは特定の曲を探していて、頭出しで「この曲じゃない」というスキップも含まれるでしょう。

で、最後まで聞かれる曲が「半分」。そうなると、残りの4分の1は、「最初の5秒」は聞きとおしたものの、曲の最後までいかないタイミングでスキップされることになります。この論文はそのタイミングを調べたところ、いわゆる「ヴァースーブリッジーコーラス」が切り替わるタイミングでそれぞれ増えるとのこと。確かに、自分でも「1番までは聴こう」とか、「コーラスに入ったタイミングで切る」とかしますからね。そうした行動をデータ分析で裏付ける、というもの。

ただ、ここで解析されているのはいわゆるヒット曲、Spotifyの上位ヒット曲100みたいな曲で、短めのポップスです。一定以上聞かれた曲でないと十分な量のスキップデータが集まらないため、とのことで、たとえば先鋭化された、いわゆる「ヴァースーブリッジーコーラス」構造になっていないアヴァンギャルドな曲とか、クラシックの組曲のような長尺の曲とか、そうしたものは対象ではありません。

まぁ、このデータは「そりゃそうだよな」という結論になっているわけですが(個人的には「4分の1が5秒以内にスキップ、50%は最後まで聞かれる」が一番面白かった)、他にもデータ解析からはいろいろなことが分かります。

ポピュラー音楽の進化:USA 1960–2010

今日の本題となる論文はこちら。

「ポピュラー音楽の進化:USA 1960–2010」というタイトルで、1960年から2010年のビルボードホット100の曲をデータ解析することで、「果たして何年に音楽的な変化があったのだろう」を調べたもの。面白いテーマです。

たとえば、主観的に「1970年はパンクが、、、」とか「1980年はN.W.O.B.H.Mによって、、、」とか、ある年が音楽史の中で重要な役割を果たした、とする論調があります(どのジャンルに注目するかでそれは変わります)。そういったものを、「ヒットチャート」に入った曲の構造を解析することで「ヒットチャートに入る音楽に、大きな変化が見られた年はあるのか」を分析したのがこの論文。

結論として「ポップミュージックは継続的に進化してたが、1964年、1983年、1991年頃に特に急速に変化した」そうです(!)。明確にデータ解析して出てくる大きな変化の年は1960-2010の50年間で3つに絞れた。それぞれの年に何が起きていたのか知りたくなります。

どのように分析したか

まず、「どのように分析したか」を説明しましょう。※直訳すると難解なのでかなり意訳しています。私の理解の範囲での意訳なので各分析手法の詳細など正しく理解したい方は原文をどうぞ。

1960年から2010年の間にUS Billboard Hot100に登場した曲に焦点を当て、Hot100の86%をカバーする17094曲の30秒間のセグメントを取得しました。今回の目的は人気のあるテイストの進化を調査することであるため、最も商業的に成功したものだけを取得しました。

ざっくり言ってしまうと、それらの曲を「コード進行(H)」「音色や雰囲気(T)」の2軸に分けています。それぞれ8種類に分類。

図1.Billboard Hot 100の音楽トピックの進化。

画像1

まずはコード進行の8分類を見ていきましょう。コード進行から何が分かるかというと、ビルボードトップ100(今回の分析対象)でどんなジャンルが流行っていたかが分かります。

画像2

H1:ドミナント7thコード = ジャズやブルースで使われる
H2:ナチュラルマイナー = 短調、マイナー調
H3:マイナーセブンスコード
 = ソウル、ファンク、ディスコで使われる
H4:スタンダードダイアトニック = 7thなどテンションがかかっていないコード進行
H5:ノーコード(無調)
 = (主にボーカルラインの)コード構造が判別できない曲、60年代、70年代にはほとんどなかったが、テクノ・ヒップホップなどリズム主体の曲が増えてくるにつれて増加
H6:ステップワイズコードチェンジ = いわゆるリフと思われる、アリーナロックでよく使われる
H7:ambiguous tonality(あいまいな調性
H8:変更のないメジャーコード = 一番多い(50年のうち43年でトップ)、カントリーやクラシックロックなど

最も頻度が高かったのはH8(変更のないメジャーコード)で、今回分析した曲のほぼ3分の2は、このトピックをかなりの頻度(> 12.5%)で示しており、主にクラシックカントリー、クラシックロック、ラブソングといったタグが付けられています。Hot 100でのその存在は非常に一定であり、50年のうち43年で最も一般的なHトピックでした。

ほかのHトピックは変動が激しく、たとえばH1(ドミナント7th)は1960年から2009年の間に平均頻度が約75%減少しました。このトピックの衰退は、Hot100でのジャズとブルースの衰退を表しています。

残りのHトピックは、他の音楽スタイルの進化を捉えています。H3は、ファンク、ディスコ、ソウルのハーモニックカラーに使用されるマイナーセブンスコードで、たとえばChicやKC&The SunshineBandなどのアーティストが良く使います。1967年から1977年の間に、H3の平均頻度は2倍以上になりました。

H6は、いわゆるアリーナロック、ハードロック(MötleyCrüe、Van Halen、REO Speedwagon、Queen、Kiss、Alice Cooperなど)で、一般的ないくつかのコード変更を組み合わせています。1978年から1985年にかけて増加し、その後1990年代初頭に減少したことは、アリーナロックの時代を示しています。

すべてのHトピックの中で、H5は頻度の最も顕著な変化を示しています。識別可能なコード構造の欠如を捉えたこのトピックは、1960年代と1970年代にはいくつかのスポークンワード音楽のコラージュ(ディッキーグッドマンのコラージュなど)は別としてほとんど存在しませんでしたが、1980年代後半に頻繁になり始め、その後、1993年にピークに達するまで急速に上昇します。おそらくヒップホップの隆盛を表しています。

続いて、音色や雰囲気の8分類を見ていきましょう。

画像3

T1:ドラム、パーカッション、アグレッシブ(攻撃的)
T2:カーム(落ち着き)、クワイエット(静けさ)、メロウ
T3:エネルギッシュ、スピーチ、ブライト(明るい)
T4:ピアノ、オーケストラ、ハーモニック
T5:ギター、ラウド、エネルギッシュ
T6:/ay/(という発音)、男声、ボーカル主体
T7:/oh/(という発音)、丸みのある音、メロウ
T8:女声、目ロディック、ボーカル主体

音色トピックの頻度も時間とともに進化します。「エネルギッシュ、スピーチ、明るい」と表現されるT3は、H5と同じダイナミクスを示し、ヒップホップ関連のジャンルの台頭にも関連しています。ただし、他の音色のトピックのいくつかは、繰り返し上下するように見え、楽器の繰り返しの流行を示唆しています。たとえば、T4(「ピアノ、オーケストラ、ハーモニック」)の進化は正弦波(周期的変化)のように見え、2000年代に1970年代に音色の質に(一周して)戻ったことを示唆しています。T5(「ギター、ラウド、エネルギッシュ」)は、1966年と1985年にピークを迎え、2009年に再び上昇する2つの完全なサイクルを経ました。2番目の大きなピークはH6のピークと一致し、スタジアムロックの隆盛にも関連しています(代表的なのはMötleyCrüeなど)。最後に、T1(「ドラム、アグレッシブ、パーカッシブ」)は1990年まで継続的に上昇します。T1はいわゆる打ち込み、ドラムマシンのサウンドに関連し、ダンス、ディスコや新しい波や、ザ・ペット・ショップ・ボーイズなどのアーティストを表しています。1990年以降T1の頻度は低下し、ドラムマシンの治世は終わりました。

音楽ジャンル別の分析

さて、音楽の多様性の進化を分析するために、このコードと音色を組み合わせて曲をジャンルに分類してみましょう。ポピュラー音楽は大きく言えば、カントリー、ロックンロール、リズム&ブルース(R`n'B)などのメインジャンルと、多数のサブジャンル(ダンスポップ、シンセポップ、ハートランドロック、ルーツロックなど)に分類されます。しかし、そのようなジャンル分けはあいまいで、正確な分析には不完全です。

カントリーやラップなどの人気のある音楽ジャンルは、部分的には音楽スタイルを捉えていますが、非公式であることに加えて、パフォーマーの年齢や民族などの非音楽的要因にも基づいています(「クラシックロック」はベテランバンドに対してよく使われるし、「K-Pop」は音楽性の分類ではなく出身国の分類に過ぎない)。つまり、「音楽ジャンル」の分類というのは難しいテーマです。

このため、トピック頻度から導出された主成分にクラスタリングするk -meansによる13ジャンルの分類法を構築しました。細かい説明は学術的なので省きますが(興味のある方は原文を)そのような統計的手法によって決定される最良のクラスタリングソリューションはk = 13であることがわかりました。つまり、13のジャンルに分類するのが、(今回の分析対象となる音楽では)統計的に正しい、ということ。それが下記の図2です。

図2.Billboard Hot 100の音楽ジャンルの進化の図

画像4

kで定義される13のジャンルの進化は、コード(H)と音色(T)の主成分でのクラスタリングを意味します。各グラフの幅は毎年のそのジャンルの出現頻度です。つまり、幅が大きくなれば「その年はそのジャンルの音楽が多かった(ヒットした)」ということ。

今回の解析手法(k -means重心の階層的クラスター分析)では、ジャンルがいくつかの大きなクラスターにグループ化され、ツリーで表されています。これらは音楽的に近しいという事。EASY -LISTENING+ LOVE-SONGクラスター(3,10)、COUNTRY + ROCKクラスター(7,9,5,13)、SOUL + FUNK + DANCEクラスター(8,11,1,12)。4番目の最も分岐した(他に対して異質な)クラスターは、HIP HOP + RAPです。

各ラベルには、そこに含まれる曲にLast.fmユーザーがつけているタグの上位4つがリストされています。人が名付けた「ジャンル名」なので、イメージしやすいと思います。この後説明しますが、影付きの領域は音楽の革命(1964年、1983年、1991年)によって分離された時代です。※なお、この13のジャンル分けは統計的に分類されたものなので、本来はジャンル名はありません。イメージしやすいように、「それらに含まれている曲は従来なんのジャンルに分類されているか」を集計して、上位4つをジャンル名としてラベルにした、ということです。だから、重複しているラベルもあります。

この図は、ポピュラー音楽のよく知られたトレンドを反映しています。たとえば、ジャンル4は、ジャズを中心としたジャンルです。ファンク、ソウル関連タグも含むこのジャンルは、1960年以降着実に減少しています。対照的に、ロック関連のタグとの結びつきが強いジャンル5と13頻度が変動しますが、ラップ関連のタグが強化されたジャンル2は、60年代、70年代は非常にまれですが、1980年代半ばから急速に拡大し、2000年代後半に再び縮小します。

音楽の多様性は失われたのか?

さて、ここで視点を変えます。いわゆるブームによって、音楽の多様性は失われたのか。よく言われるのが「ディスコブームでみんなディスコサウンドになった」とか「ロックが流行ってみんなロックばかり聴くようになった」とか。今回の本題である「音楽が大きく変化した年」というのは、つまりそうした「巨大なブーム」のことです。それは、音楽の多様性(様々なジャンルがヒットチャートにあること)が失われ、特定の音楽ジャンル(=似た音像)だけがヒットチャートを占めるようになる、つまり「音楽の多様性が失われる」ことで現れます。

図3.Billboard Hot100での音楽の多様性の進化。

画像5

結論から言えば、音楽の多様性は失われていません。これらのアイデアをテストするために、多様性の4つの年次測定値を推定しました(上の図3)。この図は多様性の4つの指標を推定します。

チャート、D Nは、今回の解析対象である17094曲に何年の曲が何曲含まれているかという分類。17094曲の選定基準は述べられていませんが、おそらく「一定期間チャートインした曲」などが基準と思われるので、ヒットチャートが目まぐるしく変わる年だとこの項目は減る傾向にありそうです。
クラスダイバーシティ、D Sは、ジャンルの有効数であり、機能的多様性を捕捉します。上で分けた13のジャンルがどれだけ出てきているか、という分類。
トピックダイバーシティ、D Tは、音楽トピックの有効数。音楽トピックとは今回の分類の基礎であるコードと音色がどれだけ多様性があるか。これが高いとさまざまなコードや音色が使われていたことになります。
音楽トピックのダイナミクス、D Yは、コードと音色がどれだけ曲の中で変化があるか。一年の標準偏差で出しています。これが高いと曲の中でコードや音色が多く変化していった、多く使われたということになります。

これらを見ていくと、4つすべてが進化しているものの、トピックダイバーシティDTとダイナミクスDYの2つが最も顕著な変化を示しており、どちらも1986年頃に最小に減少しましたが、その後は回復し、2000年代初頭に最大に増加しました。※これらの測定値は曲数とは関係ない手法で計算しているので、その年のHot100の曲数の変化は原因ではありません。また、50年以上にわたるサンプリングがほぼ完了しているため、最近の曲の過剰な表現が原因である可能性もありません。

1980年代のトピックの多様性と格差の減少は、調和の多様性ではなく音色の減少によるものです。これは、特定のトピックの進化に見ることができます(図1)。1980年代初頭、音色のトピックT1(ドラム、アグレッシブ、パーカッシブ)とT5(ギター、ラウド、エネルギッシュ)がますます支配的になりました。その後の多様性の回復は、T3(エネルギッシュ、スピーチ、明るい)が増加するにつれて、これらのトピックの頻度が相対的に減少するためです。スタイルの観点から言えば、多様性の衰退は、ニューウェーブ、ディスコ、ハードロックなどのジャンルの優位性によるものです。その回復は、ラップや関連するジャンルの台頭に伴う彼らの衰退によるものです(図2)。現在の音楽の進化の理論では通説的に「だんだん音楽は均質(似たような曲ばかり)になっている」と言われていましたが、それに反して、チャート内の音楽の漸進的な均質化の証拠はありません。今回研究した範囲、つまり50年間のビルボードチャートトップ100を見る限り、多様性が失われつつある兆候はほとんどありません(むしろ、いろいろなトピックがヒットチャートの中で出てくるようになり、曲の多様性そのものは増しています)。代わりに、チャートの多様性の変化は、歴史的にユニークなイベント、つまり音楽を作る特定の方法の興亡によって支配されています。それを見ていきましょう。

音楽の進化を停止させる「革命」

さて、今まで見てきたように「ポップミュージックは継続的に進化してたが、1964年、1983年、1991年頃に特に急速に変化した」というのは、「1964年、1983年、1991年に音楽の進化が止まった(多様性が減った)」と言い換えられます。それを裏付けるデータを見てみましょう。

図4.ビルボードホット100の連続した変化の時間分析

画像6

上の図は、音楽の変化の速度を表しています。統計手法の説明は省きますが、音楽情報検索のFoote Noveltyの方法を適用し、特定の時間ウィンドウでの距離行列の変化の大きさを推定したそう。音楽の変化の速度は、青、緑、黄色、赤、茶色の色のグラデーションで表されています。

この図は、音楽の進化が絶え間なく続く一方で、急速な変化の期間によって中断された相対的な停滞の期間があったことを示唆し、1991年頃の大きな革命と1964年と1983年頃の2つの小さな革命の3つの革命を特定しました。ピーク時と一番変化の少ない時期を比較すると、これらの革命の間の音楽の変化の速度は4倍から6倍変化しています。

この時間的分析(図5)を音楽ジャンルの進化の図(図2)と組み合わせると、これらの音楽革命が特定の音楽スタイルの拡大と縮小にどのように関連しているかがわかります。それを見ていきましょう。

1964年に起きたこと

3つの革命の中で、1964年は最も複雑です。当時はロックとソウルに関連が深いいくつかのジャンル(図2の1、5、8、12、13)の増加を示していました。これらが拡大する代わりに、ジャンル3と6(イージーリスニングや女性ボーカル・ポップス)が縮小しました。また、全体的にドゥーワップの影響の拡大も見られます。

ここからは補足ですが、今回の分析はスタイルの頻度の変化がチャートの音楽構造に影響を与える時期を示しています。つまり、「いつ、何が起きたか」の研究で、「なぜそれが起きたか(音楽スタイルの起源)」は研究の対象ではありません。ただ、1964年についてだけは追加で検証がされています。それがブリティッシュ・インベンション、つまりビートルズやローリング・ストーンズといった「ブリティッシュ・ロック」のアメリカ市場への進出、大ブームです。1963年12月26日、ビートルズはアメリカでデビュー曲「I Want To Hold Your Hand(抱きしめたい)」をリリースし、そこから数十のブリティッシュロックバンドがアメリカへ進出しました。これが一般的に「ロックの時代」の幕開けと言われますが、それが果たして1964年の革命にどのような影響を与えたか分析してみましょう。

図5. 1964年のブリティッシュインベイジョン(BI)代表であるビートルズとローリング・ストーンズの音楽的特徴

画像7

この図が何を表しているかというと、この当時増加したヒット曲の音楽的特徴を表したものです。最初に図1(音楽トピックの変化)で分類したトピックのうち、T3とH8、T7とT5、H5とH3、H1とH3のそれぞれを組み合わせた4つの要素が増加しているのが音楽的なトピックの特徴です。右側の図がビートルズ(青)とローリング・ストーンズ(赤)の曲が含むそれらの要素。それを見るとPC1(T3とH8)、PC2(T7とT5)についてはこの2バンドが高いことが分かります。ただ、そもそもブリティッシュ・インベンション以前からトレンドとして表れていた要素であり、それを極端なものにしたというのがこの2つのバンド(ひいてはブリティッシュ・インベンション)の影響であった、という分析結果。なので、「影響がないわけではないが、それ以前からあったトレンドをより極端な形で表現し、ブームを加速させた」という影響だそうです。面白いですね。

1983年に起きたこと

続いて1983年の革命は、ニューウェーブ、ディスコ、ハードロック関連のタグが強化された8、11、13の3つのスタイルの拡張と、ソフトな要素が強い3、7、12の3つのスタイルの縮小に関連しています。また、音色で言うと「T1=ドラム、パーカッション、アグレッシブ(攻撃的)」が強い。原因については論文内では分析されていませんが、話の流れやデータを見ると「ドラムマシンの隆盛」と「ハードロックの隆盛」による変化でしょう。この傾向が83年から91年まで続きます。いわゆるハードロック/ヘヴィメタルの(商業的な)全盛期であり、アリーナロックとディスコの時代ですね。ただ、猫も杓子もドラムマシン、ハードロックといった「特定の音像」になびいた(図4の下の図で赤くなった箇所)のは1983年だけで、その後はチャート上はさまざまなコード進行、さまざまな音色の多様性が戻っています。

1991年に起きたこと

3つの中で最大の革命である1991年は、スタイル5と13(ロックとハードロック)を犠牲にして、ラップ関連のタグが強化されたスタイル2の拡張に関連しています。ラップの台頭、そして、関連するジャンルは、今回、この論文で対象とした期間にアメリカのチャートの音楽構造を形作った唯一の最も重要なイベントであるように見えます。ほかに対してこの変化はあまりに大きい。それまでの30年は基本、同じ語法の中での変化でしたが、ここでルールが変わった、ぐらいの変化が起きています。

なお、これは「そうした変化が起きた」ことを表しているだけで、その年に何があったか、は分析されていません。これは個人的な意見ですが、その年ってソ連が崩壊して湾岸戦争が始まった年なんですよね。これはビルボードチャート、つまりアメリカのトレンドの分析なので、アメリカ社会の空気感や世論が大きく変わった年であることは間違いない。それが何等かの影響を与えているような気がします。

ただ、「ロックは90年代で死に、ヒップホップが主体となった」みたいな論調もありますが、実際には2000年代ぐらいからだんだんとロックも復調気味。カントリーも復調しています。物語性(歌詞)が強いヒップホップから、共に歌えたり肉体性が強いロックやカントリーへの揺り戻しもデータ上は起きているようです。

まとめ

さて、今回の論文からわかったことをまとめましょう。

1964年、1983年、1991年に音楽(USヒットチャート)は大きな変化が起きた
・その中でも1991年の変化が最も大きい(これだけが唯一真の意味での「革命」と言えるかもしれない)
・1964年にあったことはロックの台頭とブリティッシュ・インベンション
・1983年にあったことはディスコ、ニューウェーブ、アリーナロックの台頭。
・1991年にあったことはロック、ハードロックの退潮とヒップホップの隆盛。
・逆に言えば「1964年、1983年、1991年以外は(少なくとも1960年―2010年までのビルボードチャートにおいては)大きな変化の年というのはない」=ほかのトレンドは「音楽のヒットチャート全体を塗り替える」ほどの影響は持ちえなかった

ということが分かります。

色々と「○○年は何が流行った」とか「○○年以降このジャンルが増えた」とか、そういったことを話すのは楽しいものですが、こうしたデータから分析できるのは面白い時代ですね。

最後に、「最大の革命」である1991年、一番ヒットしたヒップホップの曲をお届けして今回の記事を締めくくりましょう。年間38位に入った「DJ Jazzy Jeff & The Fresh Prince - Summertime」です。

画像8

おまけ

いやぁ、大変でした。「面白いテーマだなぁ」と思って訳し始めたものの、途中からかなり難解に。統計手法とかが難しいのは研究者向けの論文なので当然なのですが、文章そのものが難しい。つまり、何を言っているのか分からない。基本的に論文って(技術的な詳細はさておき)骨子とか主張は分かりやすいんですよ。だいたい「結論→理由→検証→結論」とか、「課題提起→仮説→検証→結論」とか、型が決まっている。だけれどこの論文は構造が入り組んでいて「課題提起→手法説明→分析→課題再定義→分析→課題再定義→分析→追加検証→まとめ」みたいな作りで、そもそも課題も何度も定義されなおすというか、婉曲的。だし、文章もそのまま訳すと何を言っているのか分からない。たとえば「3.4音楽の進化は革命によって中断されます」「3.5イギリスは1964年のアメリカ独立戦争を開始しなかった」みたいな。「え?」という内容。そもそも「音楽が変化した年」を調べていたはずなのに、いつのまにか「音楽の進化が止まった年(=革命の年)」という話になっているし。なんでだろうと思ったらこれイギリスの論文っぽいですね、ロイヤル(王室)だし。ああ、アメリカ英語とイギリス英語の差かぁ。イギリスって反語表現みたいなものが多い印象「○○ではありえなかった(=○○だ)」みたいな。議論がいろいろと脇道にそれるというか、論文の中でアップデートされていくからきちんと読み込まないと意味が分からなくなる。それはそれで面白いんですけどね。文章の中の情報量も多いし。けれど苦労しました。ブルース・ディッキンソンの自伝とか読んでもめちゃくちゃ表現が婉曲ですからね。皮肉っぽいというか、どこかまでが冗談なのか良く分からない。音楽的にも英国ってそういうところがあります。たぶん、「読み手(聞き手)の期待や想像を裏切らないといけない」みたいな思考なんじゃないのかなぁ。これも読んでいるうちに何度もどんでん返しというか、そもそもの課題をどうとらえるべきか、といったところが変わっていきますからね。「思えば遠くへ来たもんだ」という感覚は、UKプログレとかに近い

分析手法についても、一番基礎のところだけは訳しておきます。ここから先は難しいので論文を読んでください。ボヘミアン・ラプソディを例にして分析手法を説明しています。

 1960年から2010年の間にUS Billboard Hot100に登場した曲に焦点を当て、Hot100の86%をカバーする17094曲の30秒間のセグメントを取得しました。私たちの目的は人気のあるテイストの進化を調査することであるため、最も商業的に成功したものだけを取得しました。
(中略)
 我々の研究は、スコアから抽出された特徴に基づいています。ラウドネス、語彙統計、シーケンシャルの複雑さなどのオーディオの技術的側面に焦点を当てて、音楽的に意味のある機能を特定しようとしました。この目的のために、テキストマイニングの最近の進歩に触発されたアプローチを採用しました(図6)。
 まず、一連の定量的なオーディオ機能を12の音色の記述子、14の音色に分けて曲を測定しました。次に、これらは「単語」に離散化され、コード変化(ハーモニックレキシコン(H-レキシコン))と、音色クラスター(ティンブラルレキシコン(T-レキシコン))に分類できました。
 T-レキシコンを平易な英語のセマンティックラベル(=一般的な音楽ジャンル)に関連付けるために、専門家による注釈を実行しました。次に、両方の語彙からの音楽的な単語を、潜在的割り当て(LDA)を使用して8 + 8 = 16の「トピック」に結合されました。LDAは、テキストのようなコーパスの階層生成モデルであり、すべてのドキュメント(ここでは歌)は複数のトピックにわたる分布として表され、すべてのトピックはすべての可能な単語に対する分布として表されます(ここでは:H-レキシコンからのコード変更、およびT-レキシコンからの音色クラスター)。
 確率的推論を使用して、最も可能性の高いモデルを取得します。したがって各曲は、
1.コード変更のクラス(「7thの和音」など)をキャプチャする8つのハーモニックトピック(Hトピック)
2.特定の音色(たとえば、「ドミナントセブンスコード変更」)をキャプチャする8つの音色トピック(Tトピック)
の分布として表されます。 
「ドラム、アグレッシブ、パーカッシブ」、「女性の声、メロディック、ボーカル」、など専門家の注釈から派生したトピックの比率をqとします。これらのトピックの頻度は、私たちの分析の基礎でした。

画像9

図6 1975年のクイーンズボヘミアンラプソディのセグメントで示されたデータ処理パイプライン。



いいなと思ったら応援しよう!