
【#2024年振り返り ②】オタク因子分析
大晦日が、一年で一番Pythonにお世話になる日。
だからGit管理は必須。地下アイドルオタクのかべのおくです。
本noteは、1年の個人的振り返り企画第1弾です。この企画の目的は、「2024年に自分はどんな現場に行って、そこでどんなライブを見たのか?どんな思い出を残したのか?を振り返る」ことです。
① 2024年現場振り返り・・・Notionに日々記録したデータをもとに、今年の現場数やチェキ枚数を振り返ります。
② 地下アイドルオタク因子分析・・・上記データをもとに因子分析を行い、現場の傾向をつかみます。
③印象に残ったライブ振り返り・・・1年間のライブの中で、とくに印象的だったものを5つピックアップして振り返ります。
④沢山通ったグループ振り返り・・・今年、とくに現場数が多かったグループについて、思い出を振り返ります。
2024年振り返り第2弾では、集計した現場データを用いて因子分析を試みます。
オタク因子分析とは?
まずは因子分析・オタク因子分析について説明します。また、予め言っておくと僕はデータ分析の専門家ではないので、数学的な話や厳密な話は置いといてざっくりとした説明に留めます。
因子分析とは
因子分析とは、「特徴量に影響を与えている要因を突き止めること」です。沢山の変数を同時に扱う際、それを分かりやすく解釈するのに役立ちます。
よく出てくる例としてテストの点数の例が挙げられます。たとえば、数学や理科の点数が高い生徒は理系力、国語や社会の点数が高い生徒は文系力が高いのではないか?と考えられます。

この理系力や文系力といった要素のことを「因子」と呼び、それをデータの羅列から見つけ出すのが因子分析という手法です。
オタク因子分析の目的
オタク因子分析の目的は、自分の通っているグループを特徴づけて分類することです。
地下アイドルのイベントには、いろんなタイプがあります。
フェス
対バン
単独ライブ(小さなライブ会場でのライブ)
ワンマンライブ(大きなライブ会場でのライブ)
リリースイベント
チェキ会
オフ会
これらのイベントにどのくらいの回数・頻度で通っているのかには、ある種の傾向が見られると考えられます。これが因子として見つけられないか?というのが因子分析のモチベーションになります。昨年度の結果は以下noteを参照。
オタク因子分析の方法
今回もPythonのsklearn.decomposition.FactorAnalysisを使って因子分析を実行しました。コードはVtuber「AIcia Solid Project」さんのGitHubを参考にしています。
因子分析にかけたデータは、以下の9つです。
対バン参加回数
ワンマン参加回数
リリイベ等参加回数
チェキ枚数
対バンチケット代
ワンマンチケット代
チェキ代
ただしイベントの種類の定義は以下の通りです。
対バン:複数のアイドルが出演するライブイベント
ワンマン:単独のアイドルが出演するライブイベント
リリイベ等:リリースイベント、その他ライブを伴わないイベント
分析したグループは、2024年に1度でもライブに行った以下の31グループです。
FES☆TIVE, ドラマチックレコード, MyDearDarlin', Jams, Bunny La Crew, SWEET STEADY, 透色ドロップ, Peel the Apple, かすみ草とステラ, ネコプラ, STAiNY, Sweet Allay, I MY ME MINE, UtaGe!, 高嶺のなでしこ, FRUITS ZIPPER, 真っ白なキャンバス, 可憐なアイボリー, CANDY TUNE, AsIs, Ringwanderung, GlimAssembler, フューチャーサイダー, シンデレラ宣言, Chimo, つばきファクトリー, Pallete Parade, Task have Fun, ベンジャス, タイトル未定, ラフ×ラフ
オタク因子分析の結果
因子分析の結果として、各因子の解釈とグループごとの得点を見ていきます。
各因子の解釈
プロマックス回転を行った後の因子負荷行列を示します。各列ごとに、数値が高いものの色が濃くなるように色付けしてあります。

各因子の解釈は以下の通りです。
第1因子:リリイベ因子
リリイベ等参加回数がの負荷量が1.054と最も高く、ついでチェキ代の負荷量が0.809。したがってリリイベ等のイベントでチェキを撮るほど、この因子による得点が高く出る。
第2因子:対バン因子
対バン参加回数の負荷量が0.751と最も高く、ついで対バンチケット代の負荷量が0.955。したがって、対バンにチケットを買って参加するほどこの因子による得点が高く出る。
第3因子:ワンマン因子
ワンマン参加回数の負荷量が0.711と最も高く、ついでワンマンチケット代の負荷量が0.623。したがって、ワンマンライブにチケットを買って参加するほど、この因子による得点が高く出る。
各グループの因子得点
上記の因子を用いて計算したイベント回数上位9グループの得点を示します。

各グループについて横方向に見ると、傾向が見えて来るので分析します。
まず、各現場は「対バン型」か「ワンマン型」かに大別できます。
対バン型(対バン因子得点>ワンマン因子得点)
→ MyDearDarlin'、Bunny La Crew、Peel the Apple、かすみ草とステラ
ワンマン型(対バン因子得点<ワンマン因子得点)
→ FES☆TIVE、ドラマチックレコード、JamsCollection、SWEET STEADY、透色ドロップ
さらに興味深い点は、イベントの参加比率もうまく表現できている点です。たとえば、JamsCollectionは対バン因子得点が0.81、ワンマン因子得点が1.05となっており、対バン・ワンマンともバランスよく通っている事がわかります。同様にSWEET STEADYも対バン因子得点が0.34、ワンマン因子得点が0.55となっています。そして、これは僕の感覚ともほぼ一致しています。
リリイベ因子については、そもそもリリイベをやっているかどうかで大きな差が出てしまうため、正直あまり参考になりません。
考察・所感
今年度のオタク因子分析は、一昨年と昨年と比べてもシンプルに仕上げました。これは過去2年頑張ってみてもよく分からなくなるという反省を踏まえたためです。
そして、結果的にここ3年で最も分かりやすいものに落ち着きました。このデータで得られる範囲ではこれが限界なんだろうと思います。
オタク因子分析のメリット・デメリットを考えてみます。
メリットは、比べようのないものを比べられることです。ワンマンと対バン、リリイベはイベントの形態が全く異なります。だから「ワンマン1回は対バン3回分」みたいに単純な比較はできません。しかし、ワンマン因子得点と対バン因子得点を比べれば、自分がどちらに比重を置いているのかは一目瞭然です。もちろん、その数値がどれくらいに信頼に値するのかという話はあるので、現状としてはエンタメとして楽しむ程度だと思われます。
デメリットは、使って意味がある人が限定される割に入力が恐ろしく面倒であることです。結局これが役に立つのは少なくとも10組以上はグループに通ってチェキを撮っている、自分のようなDDオタクだけです。しかしそういった人は思ったほど多くないんじゃないか?と最近思ってきました。その割に入力はいちいちNotionを立ち上げてセルのデータを入力しなくてはいけません。しかも、結果はPythonをかませないと出てこないので即時性という面でも不便です。
来年は因子分析は一段落して、それ以前にデータ入力と結果出力自体を楽にする方法を検討していきたいと思います。
おわりに
まとめます。
データの使い手か、あるいは奴隷か。
以上です。