#306 ポアソン分布でヤクルト村上のホームラン数を56本と予測
ヤクルトが勝てない。
でも村上のホームラン数で気を紛らわしている。さて何本まで行くだろうか?
統計的に予測してみた。
ポアソン分布に当てはめて143試合で予測してみた。
ソフトウェアはR
データはヤクルトのウェブサイトから8月21日(日)までの112試合
Rのコードは以下のとおり
install.packages(fitdistrplus)
library(fitdistrplus)
### 村上ホームラン Poisson
# ベクトルで入力
# データ https://www.yakult-swallows.co.jp/players/detail/1700084
G50 <- c(0,0,0,0,0,0,1,0,2,0,0,0,0,0,0,0,0,0,0,1,1,0,0,0,1,0,0,1,0,0,1,1,0,0,0,0,2,1,0,0,0,0,1,0,1,0,0,0,0,1)
G80 <- c(0,0,0,0,1,0,0,0,0,1,2,0,0,0,2,0,0,2,2,0,1,1,2,0,0,0,0,0,0,0)
G100 <- c(0,0,1,0,0,1,0,0,0,1,0,1,0,0,1,3,2,0,0,0)
G112 <- c(0,0,0,1,1,0,0,1,0,0,2,0)
# 途中経過で別にする
MH50 <- G50
MH80 <- c(G50,G80)
MH100 <- c(MH80,G100)
MH112 <- c(MH100,G112)
## 確認
MH112
length(MH50)
length(MH80)
length(MH100)
length(MH112)
## 各分布でプロットしてみる
fit112n <- fitdist(MH112,"norm")
fit112e <- fitdist(MH112,"exp")
fit112p <- fitdist(MH112,"pois")
plot(fit112n)
plot(fit112e)
plot(fit112p)
## ポアソン分布に当てはめ
fit112 <- fitdist(MH112,"pois")
fit100 <- fitdist(MH100, "pois")
fit80 <- fitdist(MH80, "pois")
fit50 <- fitdist(MH50, "pois")
## 信頼区間90%(片側5%)
PH112 <- fit112$estimate+qnorm(0.95)*fit112$sd*c(-1,1,0)
PH100 <- fit100$estimate+qnorm(0.95)*fit100$sd*c(-1,1,0)
PH80 <- fit80$estimate+qnorm(0.95)*fit80$sd*c(-1,1,0)
PH50 <- fit50$estimate+qnorm(0.95)*fit50$sd*c(-1,1,0)
## 143試合にして表示
PH112*143
PH100*143
PH80*143
PH50*143
gofstat(list(fit112n,fit112e,fit112p),fitnames=c("Normal","exp","pois"))
離散データなので正規分布や指数分布は無理がある。ポアソン分布でやってみた。範囲を90%区間(5%)で切ってみた。
結果は以下のとおり
50試合時点からだんだん上がっている。調子がよくなっている。直近のデータからであれば結果はもっと高くなるでしょう。
112試合(8月21日)までのデータから42本~70本。
真ん中で56本。
村上の背番号(55)は超える。
最高で70本は行く。バレンティンも越せる。
範囲をもっと緩く95%区間(2.5%)に代えてみた。
チョー楽観的にすれば72本は行くぞ!!!