大相撲力士の強さをまた分析してみた
前回、Bradley-Terryというモデルを使って、力士の強さを数値化しましたが、大相撲好きとしてはやはり、大相撲の特徴を捉えた強さ判定モデルを自分で考えて数値化したいところです。
ということで今回、ベイズ推定やらコーシー分布やらによって、力士の強さを数値化してみました。
2001〜2018 強い力士トップ20
data {
int N;
int M;
int<lower=1, upper=N> Id[M, 2];
}
parameters {
vector[N−1] mu0;
real<lower=0> s_mu;
vector<lower=0>[N] sigma;
ordered[2] performance[M];
}
transformed parameters {
vector[N] mu;
mu[1:N-1] = mu0;
mu[N] = -sum(mu0);
}
model {
mu ~ normal(0, s_mu);
sigma ~ gamma(10, 10);
for (i in 1:M)
for (j in 1:2)
performance[i, j] ~ cauchy(mu[Id[i, j]], sigma[Id[i, j]]);
}
こんな感じのモデルでやってみた結果が、
これです。
2001年以降のほぼ全取組をもとに数値化して、上から20人抜き出しました。
白鵬、朝青龍が飛び抜けてますね。
武蔵丸や貴乃花は引退前の2,3年分の取組しかないので、プロットが縦に広がっています。
現役横綱である稀勢の里と鶴竜は、最高位が大関であった栃東、把瑠都、魁皇より弱いという結果になりました。
現役幕内力士
上の結果の、現役の幕内力士を抜き出すと、
こんな感じです。
数値が大きく(強い)、プロットが広がっている(取組数が少ない)、
阿武咲、御嶽海、貴景勝、北勝富士、阿炎、朝乃山
辺りは、若手注目力士であると言えそうです。
まとめ
白鵬、朝青龍は強すぎる。
稀勢の里、鶴竜はもう少し頑張ってほしい。
阿武咲、御嶽海、貴景勝、北勝富士、阿炎、朝乃山はこれから来そう。
技術的なことは、下のQiita記事に少し詳しく書いてあります。