
Apple MusicとiTunesの再生回数データを取得し、Pythonを用いて集計するキリッ ⇒ 無理でした
最後に、再生履歴を全て消します。
はじめに
先月、研究に必要になるかもしれないとのことで、Pythonの勉強を始めました。うーん、苦痛。
学習サイトで演習を繰り返すのもいいけど、どうせならなんか作りたい。
Apple Music Replay
定額制音楽サービスのひとつであるAppleMusicには、ユーザーがよく聴いた曲やアーティストを集計してくれるReplayという機能があります。筆者もウォークマンからの移行を始めた2020年以降、毎年楽しませてもらってます。

このApple Music Replayですが、ずっともやもやすることがありました。それは、CDで取り込んだ曲は反映されないという点です。
わかっています。至極当然のことです。
でも、筆者はサブスク(≒AppleMusic)にない曲も結構聴くので、「よく聴いた曲」という意味では厳密な集計結果からは結構ずれてしまうんですよね。
iTunes上から再生回数データは確認できるが…(読み飛ばし推奨)
iTunesを併用しているApple Music ユーザー以外には伝わりにくいと思うのですが、iCloudミュージックライブラリという機能があり、CDで取り込んだ曲でもサブスクのそれとほぼ同じような扱いをすることができます。
つまり、ミュージックアプリの曲は「サブスク由来」と「CD由来」の二種類があるわけです。
(「Apple Music」は配信サービス、「ミュージックアプリ」はiPhoneのアプリケーション、「iTunes」はPCのアプリケーションを指します。)

また、iTunesにも再生回数をカウントしてくれる機能があり、サブスク由来もCD由来も同様に再生回数をカウントしてくれます。この再生回数はミュージックアプリで再生した分も含まれます。ただこのままだと「曲を再生回数順に並び替える」以上のことはできません。

というわけで
・Apple musicはサブスクにある曲のデータしか集計してくれない
・iTunesはサブスク、CDの曲の両方をカウントしてくれているが、再生回数を見ることぐらいしかできない
・pythonでなんかしたい
以上の理由から、
iTunesから再生回数データを取得し、pythonを用いて集計する
ことに挑戦しました。
方法
元データ
iTunesで、「ファイル>ライブラリ>ライブラリを書き出す」で、データを取得することができます。xmlファイルというのが調べてもよくわからなかったので、テキストファイルで取得しました。


曲名やアーティスト、再生回数や曲の長さについての情報が含まれています。
コード
前述のとおり筆者はプログラミングを始めて一か月と満たないド素人なので、主に参考にしたサイトを貼るに留めます。pandasすら知らない状態でしたが、テキストファイルを加工し辞書のリストを作る力技でなんとか行き着くことができました。
集計内容は以下の通り
・曲: 再生回数TOP100
・曲: 再生時間TOP100
・アーティスト: 再生回数TOP100
・アーティスト: 再生時間TOP100
・再生回数TOP50のアーティストについて再生回数ランキング作成
※ 再生時間 = 再生回数×曲の長さ

参考にさせていただいたサイト
結果を見よう!!!
問題発生

・・・
BUMP少なくね???
BUMPに絞ったランキングを確認してみよう。


おかしい
おい
原因究明
いろいろ調べて確認してみた(超絶雑説明)ところ、Apple Musicで聴いてはいたけどライブラリに追加していない曲は再生数のカウントが正確になされていないということが判明。


詰んだ~~~~
再生回数全部消す
今後、よく聴く曲はライブラリに追加することにしよう。

これで、これからは正確に再生回数データが記録されるものと予想されますが、これまでのガッタガタのデータはもうどうしようもありません。
。。。







余談
一応統計はとってみる
曲数を基準に比較を行い、気になるものは詳細を見ていこう

おい
Excel使うなよ
米津玄師
曲数101, 総再生数2940, 曲あたり平均再生数29.1, 標準偏差15.4


ハチ時代から大好きな米津玄師。Apple Music導入直後のウォークマン併用期、AppleMusicはほぼ米津専用機と化していた(特に合理的な理由はないけど)。その時期に出たアルバム(STRAY SHEEP)とプレイリストを組んでいたB面の曲が目立つ。人生トータルで見たらYANKEEが一番。たらればはやめよう。
THE HIGH-LOWS
曲数163, 総再生数2018, 曲あたり平均再生数12.4, 標準偏差13.7


サブスクが無いので、100%正確に記録されているはず。
ちゃんと聴きだしてから一年たっていないながらトータル再生2000回以上を記録。じっくり聞けてないアルバムだったり、同じ曲の別バージョンが結構あったりと、上位と下位の差が大きい印象
THE BACK HORN
曲数284, 総再生数1351, 曲あたり平均再生数4.8, 標準偏差6.9


2022年度一番聴いたアーティストであり、ライブラリに追加せずに聞いていたアーティストの筆頭。
上位曲でかなりの割合を占めていた先述の二つとは異なり、上位50曲までで累積相対度数が60%と比較的低い。正確な記録ができていなかったことが悔やまれる。
SEKAI NO OWARI
曲数76, 総再生数1362, 曲あたり平均再生数17.9, 標準偏差14.1


たぶん正確に記録されている。分かる人にはわかると思うが、アルバム「eye」の最初の方をめちゃくちゃ聞いていた。そこに割り込むErrorが一番好きな曲だったりする。
THE BLUE HEARTS
曲数144, 総再生数1435, 曲あたり平均再生数10.0, 標準偏差7.4


ハイロウズと同様100%正確。上位陣がとがり散らしていたハイロウズと異なり、なめらかなカーブとなった。
indigo la end
曲数135, 総再生数1172, 曲あたり平均再生数8.7, 標準偏差11.5


アルバム「濡れゆく私小説」の曲が上位を占める。好きだから。また、ライブラリに追加するだけして聴けてないアルバムが多いのも特徴。ごめん。
BUMP OF CHICKEN
曲数182, 総再生数776, 曲あたり平均再生数4.3, 標準偏差15.0

悔しい。
ほぼ記録できてない。
悔しい。
本当は一番聴いてるはず。
悔しい。
エレファントカシマシ
曲数240, 総再生数539, 曲あたり平均再生数2.25, 標準偏差4.1

記録できてない+Apple Musicへの移行が最も遅れたというのもあり、体感の再生数との乖離が大きくなった。
フレデリック
曲数69, 総再生数491, 曲あたり平均再生数7.1, 標準偏差7.0

卒論のお供。修論でもよろしく。
ザ・クロマニヨンズ
曲数195, 総再生数572, 曲あたり平均再生数2.9, 標準偏差4.8

iTunesに取り込むのがめんどくさくてCDのまま聴いてた時期があった。これから増える。多分。
andymori
曲数38, 総再生数187, 曲あたり平均再生数4.9, 標準偏差8.2

最近来てる。一曲の時間が短いのでとてつもないことになる予感。
Gyoson
曲数7, 総再生数109, 曲あたり平均再生数15.6, 標準偏差5.0

新曲を聴きたいよ。
曲TOP100

特に言うこともない。もはや。
おわり
(おわり)