Spotifyデータから「世界のヒットチャート類似度」を可視化してみる...日本は最も他国と似ていない国?
日本に住む私達が普段よく聴いている音楽というのは、どれくらい他国と似ているのでしょうか?
そこでSpotifyが公開している世界72ヶ国のWeekly Top 200チャートのデータを使って「72ヶ国の国同士のヒットチャート類似度」の分析を行ってみました。
日本のチャートは世界で最も他国と似ていない
分析には2022年全週分のデータを使い、楽曲の重複度合いだけでなく「順位」の要素も加味して計算し、ヒートマップとして視覚化してみました。
国名は、他国との順位相関係数合計の降順にソートしており、色が濃赤に近いほど似ていて、青に近いほど似ていないということになります。
日本は... 一番下に現れます。
つまり日本のヒットチャートは「世界で最も他国と似ていない」ということになります。
そしてちょっと着目したいのは順位相関係数に「負の値」が多いことです。
今回の類似度の計算にはSpearmanの順位相関係数というものを使用しています。
この場合、A国とB国の順位相関係数が「1」に近ければ、両国のチャートの順位付けは非常によく一致していることを意味します。
つまり、ほとんどの曲が両国のチャートで同じように人気があり、チャート上位200曲にはほぼ同じ曲が含まれている、ということになります。(なのでA国とA国同士の係数は完全一致を示す「1」となります。)
A国とB国の音楽シーンの好みが非常に近いと言えるわけですね。
一方、相関係数が「-1」に近い場合、両国のチャートの順位付けは正反対であることを示します。
つまり、ある国で人気のある曲が、もう一つの国では人気がない可能性があります。この場合、A国とB国の音楽シーンの好みがかけ離れているとうことになります。
日本の他国の対する順位相関係数は負の値といっても「-0.2」 ほどが下限なので、ごくごく弱い相関と考えられますが、その限りにおいて 、
「日本で人気が高い楽曲が、他の国々では高くなく、逆に、他の国々で人気の高い楽曲が、日本では高くない」
という傾向がある可能性を示しているように思えます。
わが国ながらなんとユニークなことでしょう...
他にも他国の結果をみてみると、なかなかおもしろいことがみえてきます。
互いによく似る中南米スペイン語圏
例えばスペイン語圏を中心とした中南米の国々にハイライトしてみみると、よく似たヒートマップのグラデーションを持っていることがわかります。局所的に赤い色が濃く、そのパターンが似ています。
つまりスペイン語圏を中心とした中南米の国々は、「その他の地域とはそれほど似ていないけど、互いには比較的よく似ている国々」 というようなグループを形成しているようにみえますね。
意外と他国と似ているインドのヒットチャート
ちょっとおもしろいのはインドでしょうか。 世界最大の制作本数規模とされるボリウッド映画曲が根強い人気というイメージがありますが、比較的多くの他国とチャートイン楽曲が似ている国である、ということがわかります。
藤井風 さんの「 死ぬのがいいわ」がJ-POPとして初のチャートインを果たしたことも記憶に新しいですね。
カントリーとヒップホップで世界と似ない米国
世界中で聴かれているイメージのある米国発の音楽ですが、当の米国で聴かれているTop 200の他国との類似度は、意外なほど高くなく、下から数えた方が早いくらいです。
テイラー・スイフトさんの楽曲のように世界中で聴かれるヒット曲を発信しながらも、米国内で聴かれている楽曲や順位はけっこうユニーク、ということなのかもしれません。
この内実について、チャート分析家のKeiさんから次のようなご指摘をいただきました。
つまり米国では、国境や文化の違いを越えて流通していく音楽が生まれつつ、ヒップホップやカントリーのように比較的国内を中心に愛聴される音楽もある、ということのように思えますね。
日本においては米国のカントリー歌手や楽曲というとそれほど知名度がないとしても、国内では着実な支持を得ているというわけです。
日本からだけみていると「米国のヒットチャート≒世界のヒットチャート」と捉えがちですが、こうしてデータ可視化してみるとむしろ逆だったということがわかるのがおもしろいところですね。
人口動態と、ヒットチャートの独自性
私達の住む東〜東南アジアにも目を向けてみましょう。
中国や北朝鮮にはSpotifyが存在しないので他の国々で、ということになりますが、この地域で最も他国との類似度が高いのは、シンガポールです。
つまりシンガポールでは、東〜東南アジアの中ではもっとも他の国と音楽の好みが似ている、ということになります。
シンガポールは人口規模の割に再生回数規模が大きな国ですが、今回の分析結果からはシンガポール人口の4割弱が外国人とされることが想起されます。
ある国のヒット曲群のユニークネスの背景には、言語、外国人比率、移民受け入れ状況といった要素もいくらかあるのかもしれませんね。
なお「国別のヒットチャート楽曲の流動性」の面から行った分析は23年2月9日の連続ツイートにまとめています。
ここでも日本で一年間のチャートにチャートインする楽曲数は世界で三番目に少ない623曲でした。
いっぽう当研究室で興味深く感じたのは、登場楽曲数の上位11カ国がすべて(米国ではなく)欧州諸国で占められいてるという事実です。
EU諸国もそうですが、特に楽曲数が最多となっているドイツでは、2012年以降、毎年100万人を超える外国人が移住していることが人口統計から確認できます。またEUの中で最も多くの難民を受け入れているのが特徴のようです。
ドイツではピークの2015年に、214万人の移民を受け入れています。これを日本の人口に置き換えて考えてみると、日本の15歳人口は2021年10月時点での総務省推計によると約107万人(外国人含む)なので、その2倍以上の人口が海外から1年間のうちにやってきていたということになります。
また2020年時点でドイツ総人口約8000万人の27%が移民のバックグラウンドを持っているとされます。
当研究室でもeurostatのデータからEUにおいて移民人口が多い国の上位10ヶ国の推移を視覚化してみました(2023年2月20日加筆)。
ドイツは総人口も多いですが、100万人前後の他国の人口が毎年増えているとう状態は、決して小さくない社会的インパクトを生んでいるように思えます。
いずれにしましてもこうした言語的、地政学的、外国人人口比率などのファクターは、ヒットチャートの流動性に対して、その国の音楽産業や文化・制度的な面での開放性や閉鎖性以外にも、影響を与えている可能性が考えられます。
それは複合的なメカニズムで、若年人口比率といった単一の軸で説明しきれるものではないように思われます。
同じ先進国や、同じ人口規模の国であっても、日本以外の多くの国はそもそも移民や言語といった面で私達の社会以上に多様性の高い状況を抱えていると考えられます。
それを念頭に置いてデータを読む必要があるように感じます。
いずれにしましても今回の分析結果から得られた「日本のヒットチャートは世界で最も他国と似ていない」という結果も、単なる良し悪しを超えて、そうしたファクターを背景とした何らかの「必然」に想像力を働かせたいとお思います。
日本のヒットチャートの独自性について、チャート分析家のKeiさんからは「洋楽の受け入れ度が低くなったことが影響しているのでは」という見方を示してくださいました。
J-POPの隆盛はもちろん、J-ROCK、J-RAP、アニソン、ボーカロイド…など、あえて洋楽を取り込まなくても、一定の多様性をもった音楽文化が形成され、近年ではそこにシティポップや昭和歌謡、90年代J-POPといった過去の楽曲群が加わっています。
こうした潮流が現在の私達の洋楽ニーズを相対的に高くないものにしているのかもしれません。
ただこれもまた一つの仮説ですので、今後もデータとして検証することで、驚きともにひっくり返ることがあるのかもしれません。
オープンデータ分析のおもしろさ
今回扱ったようなデータのおもしろさは、従来の定量調査と違って「人間の調査設計者がいない」ところに由来しているように思えます。
人間だったら、まず仮説を立てて、それを証明しようと意図して調査設計や質問票を考えます。
ところがビッグデータには、Spotifyのようなサービスとその提供システムだけがまずあって、それらを生活者が利用することで結果的に生成される膨大なデータが分析対象となります。
だから自説に好都合なアウトプットというのが比較的作りにくい。
むしろ逆に今回のように「そういう面もあるかしらんとおもっていたけど、まさかそこまでとは!?」というように、人間の思い込みを鮮やかにひっくり返してくれる側面が多々あるように思えます。
もちろんそのような場合でもまずは仮説をもってデータを収集したり分析アルゴリズムを書くわけですが、どこかに「仮説と違う結果が出るとおもしろいかもな...」と期待している自分がいます。
世界のオープンデータを収集し、Pythonでアルゴリズムを組んで、計算し、可視化する…結果出力するまでは計算量によって数秒経ったり数時間だったりもしますが、待っている間、ドキドキしている自分がいます。
でも、「おもてたんとちがーう!」という結果が現れたき、それが自分の仮説と異なるものだったとしても、ポジティブな意味で大変高揚してしまいます。
以上、徒然研究室でした。Twitterでもオープンデータとプログラミングで関心あることを分析してツイートしております。どうぞご贔屓に。