ボードゲームのデータ解析に関する雑感
今週、Twitterのボードゲーマー界隈では、べよ(@behonest00033)さんが翻訳したボードゲームのデータ解析に関する記事が話題になった。
私はデータサイエンティストではなく、ボードゲームギークになったのもつい最近のことだが、自分なりに理解するところを記す。
なお、元記事には、「その3」もある。こちらは、ボードゲームの「地図」を作ろうという大変面白い話題なので、興味のある方は是非見てほしい。
Weightバイアスと新規性
「その1」で指摘されていることとして、「評価のインフレ要素」がある。すなわち出版年別のボードゲームの評価を見ると、2002年当たりから明らかに点数が上がっている。素直に読めば、ゲーム全体のレベルが上がっているということだが、「ゲーム自体が必ずしも良いものとなっていないのにかかわらず、平均的な評価は上がっている可能性」がある。
他方で、複雑性の増加も見て取ることができる。すなわち、1990年中盤以降から、ボードゲームの評価が上がっているだけでなく、複雑さも増しているように見える。
そして、ボードゲームの複雑性とBGGの評価には明らかに相関がある。評価に対する複雑性の影響を取り除こうと試みたのが先に紹介した話題の修正ランキングだ。
(出典:An analysis of board games: Part II - Complexity bias in BGG)
ここで1つ、次の仮説を思いつく。「ボードゲームの出版年が遅いほど評価が高い傾向にあるのは、出版年が新しいほど複雑性が高いからではないか。」というものだ。しかし結論から言うと、そうでもなさそうである。
この仮説を検証しているのが、こちらの記事である。
こちらの図をご覧いただきたい。出典は上記記事である。
この図は、重さと評価の値に基づく分布図であるが、出版年別に色分けされている。たしかに、重いゲームは増えているし、重いゲームを評価する傾向は1994年から一貫していることは見て取れる。しかしここで注目したいのは、軽いゲームも新しいもののほ方が評価を受けている傾向にあるということだ。
このことから、新しいゲームが評価される傾向にあるのは、必ずしも重さだけが原因ではないということがわかる。
メカニクスと評価の関係
元記事の著者であるDinesh Vatvani氏は、記事と関連するJupyter Notebookを公開しており、ここには記事化されていない興味深い分析が埋まっているので、いくつか紹介したい。まずはメカニクスと評価の関係だ。
次の図を見ていただきたい。
(出典:Dinesh Vatvani氏のJupyter Notebook)
この図は、各メカニクスの有無を説明変数、評価を目的変数とした、最小二乗法による多変量解析である。簡単に言えば、あるメカニクスをゲームに加えることで、BGGの評価が何点上がるか/下がるかという目安だ。
図のオレンジ色は係数、黒色のバーは標準誤差だ。そのメカニクスを取り入れることで、だいたいオレンジ色の点数の増減が期待でき、その精度は黒いバーの範囲でばらつきがあるという理解でよいと思う。
中位のメカニクスはあまり良い精度ではないが、上位のメカニクス、下位のメカニクスが好まれるか否かはハッキリしている。近年話題のワカプレとデッキビルディングの組合せは、理にかなった(エビデンスのある)デザインであるとわかるだろう。
カテゴリーと評価の関係
同じくDinesh Vatvani氏のJupyter Notebookから、カテゴリーを説明変数として回帰分析を行った図を紹介する。こちらから、BGGのユーザーがどのようなテーマを好むかがわかり、興味深い。
(出典:Dinesh Vatvani氏のJupyter Notebook)