見出し画像

Apple MusicとiTunesの再生回数データを取得し、Pythonを用いて集計するキリッ ⇒ 無理でした

最後に、再生履歴を全て消します。


はじめに

先月、研究に必要になるかもしれないとのことで、Pythonの勉強を始めました。うーん、苦痛。
学習サイトで演習を繰り返すのもいいけど、どうせならなんか作りたい。

Apple Music Replay

定額制音楽サービスのひとつであるAppleMusicには、ユーザーがよく聴いた曲やアーティストを集計してくれるReplayという機能があります。筆者もウォークマンからの移行を始めた2020年以降、毎年楽しませてもらってます。

筆者のApple Music Replay(2022)

このApple Music Replayですが、ずっともやもやすることがありました。それは、CDで取り込んだ曲は反映されないという点です。

わかっています。至極当然のことです。

でも、筆者はサブスク(≒AppleMusic)にない曲も結構聴くので、「よく聴いた曲」という意味では厳密な集計結果からは結構ずれてしまうんですよね。

iTunes上から再生回数データは確認できるが…(読み飛ばし推奨)

iTunesを併用しているApple Music ユーザー以外には伝わりにくいと思うのですが、iCloudミュージックライブラリという機能があり、CDで取り込んだ曲でもサブスクのそれとほぼ同じような扱いをすることができます。
つまり、ミュージックアプリの曲は「サブスク由来」と「CD由来」の二種類があるわけです。
(「Apple Music」は配信サービス、「ミュージックアプリ」はiPhoneのアプリケーション、「iTunes」はPCのアプリケーションを指します。)

だいたいこんな感じ


また、iTunesにも再生回数をカウントしてくれる機能があり、サブスク由来もCD由来も同様に再生回数をカウントしてくれます。この再生回数はミュージックアプリで再生した分も含まれます。ただこのままだと「曲を再生回数順に並び替える」以上のことはできません。

上位二つが強すぎる


というわけで

・Apple musicはサブスクにある曲のデータしか集計してくれない
・iTunesはサブスク、CDの曲の両方をカウントしてくれているが、再生回数を見ることぐらいしかできない
pythonでなんかしたい

以上の理由から、
iTunesから再生回数データを取得し、pythonを用いて集計する
ことに挑戦しました。

方法

元データ

iTunesで、「ファイル>ライブラリ>ライブラリを書き出す」で、データを取得することができます。xmlファイルというのが調べてもよくわからなかったので、テキストファイルで取得しました。

ここから取得
取得したファイル

曲名やアーティスト、再生回数や曲の長さについての情報が含まれています。

コード

前述のとおり筆者はプログラミングを始めて一か月と満たないド素人なので、主に参考にしたサイトを貼るに留めます。pandasすら知らない状態でしたが、テキストファイルを加工し辞書のリストを作る力技でなんとか行き着くことができました。

集計内容は以下の通り
・曲: 再生回数TOP100
・曲: 再生時間TOP100
・アーティスト: 再生回数TOP100
・アーティスト: 再生時間TOP100
・再生回数TOP50のアーティストについて再生回数ランキング作成

※ 再生時間 = 再生回数×曲の長さ

素人ながら、がんばった。

参考にさせていただいたサイト


結果を見よう!!!

問題発生


アーティストごと再生回数ランキング



・・・





BUMP少なくね???




BUMPに絞ったランキングを確認してみよう。


BUMPの再生回数ランキング


2022のリプレイ(再掲)


おかしい


おい


原因究明

いろいろ調べて確認してみた(超絶雑説明)ところ、Apple Musicで聴いてはいたけどライブラリに追加していない曲は再生数のカウントが正確になされていないということが判明。

筆者はプレイリストをよく作る
ライブラリに追加せずに聴いてた曲。再生回数一回。



詰んだ~~~~



再生回数全部消す

今後、よく聴く曲はライブラリに追加することにしよう。

お前、そのためにあったんか?


これで、これからは正確に再生回数データが記録されるものと予想されますが、これまでのガッタガタのデータはもうどうしようもありません。


。。。



ctrl + A





あああ



持って行かれました
ついでにプレイリストも一掃した。200個以上あったからね。


余談

一応統計はとってみる


曲数を基準に比較を行い、気になるものは詳細を見ていこう



おい


Excel使うなよ



米津玄師

曲数101, 総再生数2940, 曲あたり平均再生数29.1, 標準偏差15.4

TOP50。
再生回数を多い順に並べた。万遍なく沢山聴いている。綺麗なカーブ。


ハチ時代から大好きな米津玄師。Apple Music導入直後のウォークマン併用期、AppleMusicはほぼ米津専用機と化していた(特に合理的な理由はないけど)。その時期に出たアルバム(STRAY SHEEP)とプレイリストを組んでいたB面の曲が目立つ。人生トータルで見たらYANKEEが一番。たらればはやめよう。

THE HIGH-LOWS

曲数163, 総再生数2018, 曲あたり平均再生数12.4, 標準偏差13.7

TOP50
再生順

サブスクが無いので、100%正確に記録されているはず。
ちゃんと聴きだしてから一年たっていないながらトータル再生2000回以上を記録。じっくり聞けてないアルバムだったり、同じ曲の別バージョンが結構あったりと、上位と下位の差が大きい印象

THE BACK HORN

曲数284, 総再生数1351, 曲あたり平均再生数4.8, 標準偏差6.9

TOP50
曲数が、多い

2022年度一番聴いたアーティストであり、ライブラリに追加せずに聞いていたアーティストの筆頭。
上位曲でかなりの割合を占めていた先述の二つとは異なり、上位50曲までで累積相対度数が60%と比較的低い。正確な記録ができていなかったことが悔やまれる

SEKAI NO OWARI

曲数76, 総再生数1362, 曲あたり平均再生数17.9, 標準偏差14.1

TOP50
曲数が少ない


たぶん正確に記録されている。分かる人にはわかると思うが、アルバム「eye」の最初の方をめちゃくちゃ聞いていた。そこに割り込むErrorが一番好きな曲だったりする。

THE BLUE HEARTS

曲数144, 総再生数1435, 曲あたり平均再生数10.0, 標準偏差7.4

TOP50
最も綺麗なカーブとなった。

ハイロウズと同様100%正確。上位陣がとがり散らしていたハイロウズと異なり、なめらかなカーブとなった。

indigo la end

曲数135, 総再生数1172, 曲あたり平均再生数8.7, 標準偏差11.5

TOP50
0が多い

アルバム「濡れゆく私小説」の曲が上位を占める。好きだから。また、ライブラリに追加するだけして聴けてないアルバムが多いのも特徴。ごめん。

BUMP OF CHICKEN

曲数182, 総再生数776, 曲あたり平均再生数4.3, 標準偏差15.0

TOP10

悔しい。

ほぼ記録できてない。

悔しい

本当は一番聴いてるはず。

悔しい。

エレファントカシマシ

曲数240, 総再生数539, 曲あたり平均再生数2.25, 標準偏差4.1

TOP20

記録できてない+Apple Musicへの移行が最も遅れたというのもあり、体感の再生数との乖離が大きくなった。

フレデリック

曲数69, 総再生数491, 曲あたり平均再生数7.1, 標準偏差7.0

TOP20

卒論のお供。修論でもよろしく。

ザ・クロマニヨンズ

曲数195, 総再生数572, 曲あたり平均再生数2.9, 標準偏差4.8

TOP30

iTunesに取り込むのがめんどくさくてCDのまま聴いてた時期があった。これから増える。多分。


andymori

曲数38, 総再生数187, 曲あたり平均再生数4.9, 標準偏差8.2

TOP10

最近来てる。一曲の時間が短いのでとてつもないことになる予感。


Gyoson

曲数7, 総再生数109, 曲あたり平均再生数15.6, 標準偏差5.0

全曲

新曲を聴きたいよ。


曲TOP100


特に言うこともない。もはや。


おわり

(おわり)

いいなと思ったら応援しよう!