【2023年振り返り②】地下アイドルオタクの「オタク因子分析」
紅白が始まるまでにこのnoteを終えたい。
地下アイドルオタクのかべのおくです。
2023年振り返り第2弾です。第1弾はこちら。
このnoteでは、2023年のオタク活動データを使って因子分析を試みます。早速なのではじめましょう。
オタク因子分析とは?
まずは因子分析・オタク因子分析について説明します。基本的に昨年と同じ説明なので、読み飛ばしてもらっても構いません。
因子分析とは
予め言っておくと僕はデータ分析の専門家ではないので、数学的な話や厳密な話は置いといてざっくりとした説明に留めます。
因子分析とは、「特徴量に影響を与えている要因を突き止めること」です。沢山の変数を同時に扱う際、それを分かりやすく解釈するのに役立ちます。
よく出てくる例としてテストの点数の例が挙げられます。たとえば、数学や理科の点数が高い生徒は理系力、国語や社会の点数が高い生徒は文系力が高いのではないか?と考えられます。
この理系力や文系力といった要素のことを「因子」と呼び、それをデータの羅列から見つけ出すのが因子分析という手法です。
オタク因子分析のモチベーション
オタクがアイドルを推す理由は1つではありません。
ライブが楽しいから
メンバーが可愛いから
推しメンを支えたいから
以上のような因子が、オタクの消費活動データから読み取れないか?というのがモチベーションです。
昨年の因子分析では、4つの因子を以下のように解釈しました。
ワンマン因子
チェキ因子
対バン因子
ついでに因子
以上をもとに、現場に通っているグループを以下の2タイプ分類できるのでは?というのが一旦の結論でした。
ワンマン移行組(JamsCollection、ネコプラ、chuLa)
対バン手探り組(MyDearDarlin'、ベンジャス!、I MY ME MINE)
この傾向が今年はどうなったのか?どのように分類できるのか?が今年のポイントです。
オタク因子分析の方法
今回もPythonのsklearn.decomposition.FactorAnalysisを使って因子分析を実行しました。コードはVtuber「AIcia Solid Project」さんのGitHubを参考にしています。
因子分析にかけたデータは、以下の9つです。
それぞれイベントの種類(対バン、ワンマン、リリイベ等、合計)ごとに別々に集計しています。合計3×9=27種類のデータを用いました。
また、因子分析を行ったのは以下の21グループです。基本的に、年内に一度でもライブを見て、特典会に行ったグループを基準としています。
それぞれのグループについて、上記の27種類のデータを抽出しました。つまり、解析に用いたデータは合計で3×9×21=567個です。
オタク因子分析の結果
それでは因子分析の結果を見ていきましょう。因子分析によって得られた負荷量の考察と、そのあとに各グループの因子得点結果を示します。
結果① 各因子とその解釈
プロマックス回転を行った後の因子負荷行列を示します。各列ごとに数値が高いセルが分かるように色分けしてあります。
第1因子:「ワンマン・リリイベ因子」
ワンマンとリリイベ等に関する合計データの負荷量が高くなっています。単独のイベントに行けば行くほどスコアが高くなるので、と名付けます。
第2因子:「ワンマン単価因子」
ワンマン・リリイベ等の平均データの負荷量が高くなっています。1回の単独イベントでたくさんお金を落とすほど高いスコアが出ます。
第3因子:「対バン単価因子」
こちらは第2因子とは真逆で、対バンのチケ代、合計額の負荷量が高くなっています。豪華な対バンでライブを見ていればスコアが高くなると予想できます。
第4因子:「対バン回数因子」
こちらは対バンの回数、チケ代、合計額の負荷量が高くなっています。つまり多少は安くても、対バンで多くみたグループのスコアが高くなります。
第5因子:「特典会回し因子」
チェキ代の金額、枚数の負荷量が高くなっています。ライブ回数は少ないものの、なぜかチェキだけは撮っている。そんなグループのスコアが高くなると予想できます。
結果②各グループの因子得点
前述の因子について、各グループの因子得点結果を示します。グループの並び順は、だいたいライブに行った回数が多い順に並んでいます。
こちらについても、各因子ごとに結果を見ていきましょう。
第1因子:「ワンマン・リリイベ因子」
最高スコアはFES☆TIVEの4.132。当たり前ですが、現場に通っている回数が多い順に、高い数値が出ています。
第2因子:「ワンマン単価因子」
トータルのライブ回数に関係なく。一度でもワンマンに行っているグループには高い数値が付いています。最高スコアはジャムズの1.956。これは幕張ワンマンでの出費もありますし、メンバーの生誕祭などで単独ライブに行っては、決まってちゃんとチェキを回していることが影響しているでしょう。
第3因子:「対バン単価因子」
今回の因子分析のなかで最も興味深い結果です。TIFや@JAM EXPOなど、チケット代の高いライブだけでグループのスコアが高くなっており、最高スコアはyosugalaの3.613です。
第4因子:「対バン回数因子」
こちらは第3因子と異なり、純粋に対バンで見ている回数が多いグループのスコアが高くなっています。最高スコアはFES☆TIVEの2.209。
第5因子:「特典会回し因子」
あまり思ったような結果が得られておらず、解釈が難しいのが正直なところです。最高スコアは#ドレミファソラシードの2.617。
オタク因子分析の考察
グループ別タイプ考察
因子分析は一目瞭然とはいかなかったものの、なんとなくの傾向が掴めたのでそれを分類します。
①日々のライブが大事:FES☆TIVE、ドマレコ、バニクル
第4因子「対バン回数」は高いものの、第3因子「対バン単価」が低い。多少無理をしても日々の中小規模対バンに見に行っている可能性が高く、モチベーションが持続している。
②ワンマン特化:ジャムズ、マイディア、chuLa
第2因子「ワンマン単価」が高い。グループの良さをよく理解したうえで、対バンはあまり重視しない。それよりもワンマンで最高の瞬間を味わいたい。自分のなかで一つの「あがり」を迎えたグループ。
④見れたら嬉しい:ぴるあぽ、白キャン、yosugala、タイトル未定等
第3因子「対バン単価」が高い。積極的にワンマンなどには行かないものの、大きな対バンで出来たら見たいと思えて、タイテを組むときのモチベーションになっているグループ。
⑤モチベ停滞・シード期:その他全部
第1~5までのすべての因子が低スコア。対バンでも重視されていないし、ワンマンに行っているわけでもない。これは「昔は行っていたが、今はモチベが下がってor対バンが被らなくて行けない」「気になっていはいるが、対バンに被らなくて行けない」のどちらかと考えられ、今後の自分の気の持ちよう次第といえる。
2022年との変化・来年への課題
2023年は昨年に積み上げたものを生かして、短期間で分析を仕上げられたことが大きな収穫です。Notionもシートを2つ用意し、解析に必要な情報もちゃんと考慮したことで、データの加工時間も大幅に減らせました。データの集計方法としてはこれで完成したと考えています。
一方で、あまりにも時間をかけなさすぎたことが反省点です。これは年末にかけて他の趣味(合唱)と仕事が忙しすぎたことが原因だとはっきり分かっています。
加えて、昨年自分が投げかけた「本当に因子分析だけでいいのか?」という疑問は解決されていません。これについてはもう少し僕自身がデータ分析に詳しくなる、もしくは専門知識を持っている人の協力を仰ぐ必要があるでしょう。
所感
今年も駆け込み的になってしまったオタク因子分析。まだまだ改善点はあるものの、得られた結果はそこそこ納得感のあるものでした。
最近ずっと考えているのは、「オタクは矛盾を受け入れられないと続かない」ということです。
オタクがオタクだけをして生きられたらどんなに楽でしょう。実際は仕事だとか、家族だとか、友人だとか、自分の趣味とか、やることは無限にあります。
オタクをやっていても結局は煩悩ばかりです。DDをしていれば「自分は本当に大事なのはどの推しなのか?」、単推しをしていれば「これで自分は本当に幸せなのだろうか…?」と、何かしら胸に手を当てて考えたくなる瞬間はどこかにあります。
そんないろんなことを天秤にかけて、自分の限られた時間・お金を推しメンに注いでいるわけです。むしろ悩みに浸るのが怖いからこそ、余計必死にオタクに打ち込んでいるのかもしれません。
オタク因子分析は、オタクの抱える矛盾・ダブルスタンダードを明らかにする手段の一つだと考えています。どうしても主観的になりがちな「推し」や「好き」というものを、何かしらの数値で表せないか?そんなことを思いながらデータを向き合いました。
因子分析に限らず、オタクが自分の推しグループ、推しメンを客観的に認識する方法が何かしら確立されることを願うばかりですし、何かしらの力になれたらと思います。
おわりに
まとめます。
紅白が、始まってしまった。
以上です。