
Spotifyの日本トップ50の楽曲を数値だけで解釈してみる
この記事は、偏愛とマーケティング研究所のマガジン「偏愛研究レポート」に収録されています。毎週月曜に偏愛とマーケティング研究所メンバーの頭の中が更新されていくので、ぜひご覧ください。
前回は、『直感vsデータのその先』というタイトルで、結局は直感とデータのどちらが勝つのか?また、これら2つの関係はどうあるべきなのか?についてツラツラと書きました。レポート感はほとんど無い(というか全く無い)内容だったのですが、読み物としてはおもしろいので興味のある方はぜひこちらから読んでみてください。
Spotifyの日本トップ50の楽曲を数値だけで解釈してみる
音楽を数値だけで解釈するという、なんとも一部の音楽愛好家からすると怒られそうな見出しなのですが、最近はどうしてもこれをやらずにいられなかったのでもうやることにしました。
そのきっかけがこちら
Spotifyのレコメンドの裏側にある指標として「踊りやすさ」みたいなのがあるの好き
— のうとみたかし (@takashi_notomi) February 16, 2024
次はSpotifyにある楽曲の特徴量を分析してみたい
Spotify使ってる方はわかると思うのですが、 Spotifyは「●●さんスペシャル」という一人ひとりにカスタマイズしたプレイリストを自動的に作ってくれます。
(このレコメンド精度の高さは他の音楽配信サービスでもほとんどありません)
これの背景には、めちゃくちゃ数値を使っているのです。
そして、さらにすごいのがSpotifyはこの数値を公開しているのです。
(公開している数値が Spotifyの持っている全てなのかは分かりませんが、それでもかなり多様な数値があります)
Spotifyが公開している楽曲の数値情報
acousticness(アコースティック感)
dancebility(踊りやすさ)
length(曲の長さ)
energy(エネルギッシュさ)
instrumentalness(インスト感/歌声が入っていない)
liveness(ライブ感/聴衆がいるか)
loudness(音量・音圧)
mode(マイナーコード:0/メジャーコード:1)
speechiness(言葉がどれくらい入っているのか)
tempo(テンポ)
key(キー)
time_signature(拍子)
valance(悲しい感じなのか陽気な感じなのか)
popularity(相対的人気度)
実際に楽曲の数値情報を見てみる
ということで、今回はCreepy Nutsの「Bling-Bang-Bang-Born」の数値を取得してみます。(執筆時に日本のランキング1位)

これを見ると、
dancebility(踊りやすさ)が0.853と高い(最大は1)
energy(エネルギッシュさ)も0.822と高い(最大は1)
valance(悲しい感じなのか陽気な感じなのか)も0.746と高め(最大は1)
この楽曲を聞いたことがある方なら、ある程度上記の数値の内容については納得いくものになっているかと思います。
ランキング上位の楽曲に特徴はあるのか?
これで終わってしまうと、ただただCreepy Nutsの「Bling-Bang-Bang-Born」の情報取得しましたー!という記事で終わってしまうので、ここからはSpotify日本トップ50の楽曲の特徴を分析してみることにしました。
みんな大好き統計ツールRを使うことで、一瞬で出てきます。

こちらです。
今回僕らは、ランキング上位の楽曲に特徴があるのか調べたかったのですが、どうやら今回は分からないようです。(データ数が足りないようです。)
なぜかというと、popularity(相対的人気度)の行を見てみます。

全てにおいてバツがついています。
(濃い紺色の部分はpopularityとpopularityの相関係数なので1になるのは当たり前で、ここは無視します)
ここからわかることは、
日本トップ50の楽曲だけを分析すると相対的人気度と相関がある情報は分からなかった
以上です。なんか悲しいですね。
他の部分を見てみると、次のようなことが分かります。
分析してみてわかった興味深い相関関係
length(曲の長さ)とspeechiness(言葉がどれくらい入っているのか)には負の相関(相関係数: -0.53)があるので、曲が長くなれば長くなるほど言葉が入っている量が減っていく(間奏や前奏などが長くなりがち)。
length(曲の長さ)とvalance(悲しい感じなのか陽気な感じなのか)には負の相関(相関係数: -0.44)があるので、曲が長くなればなるほど悲しい(しっとりした)曲になりがち。
energy(エネルギッシュさ)とloudness(音量・音圧)には正の相関(相関係数: 0.7)があるので、エネルギッシュさが高ければ高いほど音量や音圧も大きい。
正直、3はまあそうだろうなって感じですが、それ以外に関してはなかなかおもしろい結果になりました。
個人的には、mode(マイナーコード:0/メジャーコード:1)とvalance(悲しい感じなのか陽気な感じなのか)が相関係数が負の値になっているのが、少し引っかかるポイントです(結果的に有意ではないことがわかっているが)
引き続き調べるとおもしろそうなこと
特定のアーティストの傾向分析
ランキング上位の楽曲の傾向分析
顧客年代別の傾向分析
modeとvalanceが負の相関になっているところを解き明かす
分析後記
全体的に今回はデータ数が少なかったので、次回同じ分析をするときはデータ数を増やしてやってみたいところです。
僕自身は前々から Spotifyユーザーなので Spotifyのレコメンド精度の高さは日々感じていたのですが、前半で紹介した指標を持ってレコメンドしているのは流石です。
dancebility(踊りやすさ)なんて指標が入っているとは。
しかもlength(曲の長さ)はミリセカンド(1/1000秒単位)で表示されているので、おそらく1/1000秒単位で全ての楽曲を分析しているのでしょう。
Spotify、さすがです。
さいごに
今回はかなり踏み込んだ内容になりましたが、かなりおもしろい内容になりました。反響があれば、この内容をさらに踏み込んだ内容を再来週は記事にしようかななんて思ってます。
偏愛とマーケティング研究所について
偏愛とマーケティング研究所では、データの集め方、現場で活用できるデータ分析の方法を紹介しています。 「データを活用したいけど、何をしていいのか分からない」 なんて方はお気軽にご連絡ください。
著者: 納富 崇 / NOTOMI Takashi (X: @takashi_notomi)
偏愛とマーケティング研究所 代表 / データサイエンティスト