#39 テイラースイフトがぶっちぎり1位!Accessで人気アーティスト調査(Top値)
Excelユーザー必見!Accessクエリで業務効率を飛躍的に向上させる方法を、図解入りでわかりやすく解説中。
必ずチェックして、業務を効率化しよう!
前回リンクしたcsvデータ、音楽ストリーミングサービス"Spotify"の2023年10月~12月のデータを元に歌手や楽曲の人気度について調査してみましょう。
↓リンクした元データ
↓リンク方法(前回#38)
今回はTOP値を使って人気の高いアーティストだけを抽出してみましょう。
1.テーブルの中身を見てみよう
アーティストの人気度を測りますので、テーブル「T11_Spotify_artist」を利用します。
アーティスト名の右にある「アーティスト人気度」が0( or Null)~100の範囲にあります。
100が一番人気があるアーティストで、同率のアーティストも存在します。
順を追って一番人気のアーティストを調査してみましょう。
2.降順で見てみよう
順位の高さは「アーティスト人気度」の高い順になりますので、デザインビューを用いて降順表示してみましょう。
デザインビューで「T11_Spotify_artist」を利用します。
「アーティスト人気度」を降順にして、「アーティスト名」を右に配置しました。
表示または実行をクリックしてください。
アーティスト人気度100のテイラー・スイフトが世の中で一番人気になりますね。
人気度をSpotifyがどのように集計・計算しているのかは不明ですが、他のアーティストの順位をみても順当なラインナップだと思います。
3.トップ何件を簡単に抽出
さきほどの抽出では全件リスト表示になってしまったのでトップ10だけを表示してみましょう。
「アーティスト人気度」が降順、つまり人気度最高値の100から順に下っていくので、100からつづくトップ10件となります。
左の「表示」アイコンクリックしてデザインビューにもどります。
「クエリデザイン」タブのクエリ設定(上の真ん中ぐらいの小さい窓)から、「すべて」のボックスのプルダウンをクリックします。
いろんな数字、%のリストが表示されます。
「すべて」が反転して入力可能状態なので、「10」と打ち込みます。半角数字でお願いします。
「10」となりましたね。
表示または実行をクリックします。
人気度トップ10件が表示されました。
でもレコード数は11件になっています。なぜでしょう。
理由は、人気度の87が2組存在しているため、データとしての不整合がないように1件多くなっているのです。
4.トップ値の使い方
もういちどトップ値について解説します。
デザインビューに切り替えてください。
「クエリデザイン」タブにトップの値を選択できるプルダウンがあります。
デフォルトは「すべて」になります。
プルダウンリストは5、25、100、5%、25%の5つから選べますが、任意に書き換えることができます。
例えば10%にすればトップ10%のレコードがすべて表示されます。
降順・昇順とトップ値をうまく組み合わせるといろんなバリエーションで抽出できますね。
5.トップ値の用途
上で説明した単純なトップ何件・何パーセント抽出以外にもトップ値を利用することで実現できる便利な技があります。
全レコードのうち、例えばA,B,C,Dの4つに、元数量を100%とした場合、配賦率/数が変動するとします(大阪支社、名古屋支社、博多支社、札幌支社、広島支社などに置き換えて想像してください)。
Aに全件のうち1,389件配賦、Bに残りのうち20,098,008件配賦、さらに残数から7割をCに配賦、最終残をDに配賦、といった難しい数の割り当てがトップ値を利用することで簡単に行えます。
テーブル結合とトップ値の組み合わせて、さらに乱数関数を用いることで偏りのない配賦が可能となります。
これについては、後々解説していきますのでお楽しみに。
6.おまけ
Accessの解説とはかけ離れてしまいますが、興味本位でSpotifyのテーブルを元にExcelで人気アーティスト分析をしてみました。
Accessデータの「アーティスト人気度」と「アーティスト名」の2列を全てExcelにコピペ、散布図にしたところ、上のような図になりました。
人気度0付近の数は全体の90%以上を占める一方、トップアーティスト(赤丸の部分)は棒グラフが見えないくらいの位置にいますね。
面白次いでに偏差値もExcelで計算してみました。
テイラースイフトの偏差値は脅威の96越え!
彼女の人気度は上から 0.0002%、下から 99.9998%のとこに位置します。
トップクラスのアーティスト数人が全世界の音楽業界の稼ぎを担っていることが想像できます。
平均値のアーティストも気になりますね。
偏差値50付近のアーティストになります。
ランク度でいうと、アーティスト人気度0-100のうちトップ14位15位にあたりますので、どれだけトップアーティストが上にかたまっているのかが分かりますね。
人気度の極度の二極化が進んでいることがわかります。
なお、ここで用いた分析手法、平均、標準偏差、偏差値、分散等はさまざまなWeb解説やYouTube解説がありますので、そちらでご確認ください(でも、数学頭の人が解説しているのがほとんどなので文系の私には腑に落ちない解説ばかりです…)。
「Excel データ分析 基本」などで検索してみてください。
ご覧いただきましてありがとうございました。
こちらもあわせてどうぞお読みください。