見出し画像

#306 ポアソン分布でヤクルト村上のホームラン数を56本と予測

ヤクルトが勝てない。

でも村上のホームラン数で気を紛らわしている。さて何本まで行くだろうか?

歴代シーズンホームラン数

統計的に予測してみた。

ポアソン分布に当てはめて143試合で予測してみた。

ソフトウェアはR

データはヤクルトのウェブサイトから8月21日(日)までの112試合

Rのコードは以下のとおり

install.packages(fitdistrplus)
library(fitdistrplus)

### 村上ホームラン Poisson

# ベクトルで入力
# データ https://www.yakult-swallows.co.jp/players/detail/1700084

G50 <- c(0,0,0,0,0,0,1,0,2,0,0,0,0,0,0,0,0,0,0,1,1,0,0,0,1,0,0,1,0,0,1,1,0,0,0,0,2,1,0,0,0,0,1,0,1,0,0,0,0,1)
G80 <- c(0,0,0,0,1,0,0,0,0,1,2,0,0,0,2,0,0,2,2,0,1,1,2,0,0,0,0,0,0,0)
G100 <- c(0,0,1,0,0,1,0,0,0,1,0,1,0,0,1,3,2,0,0,0)
G112 <- c(0,0,0,1,1,0,0,1,0,0,2,0)

# 途中経過で別にする
MH50 <- G50
MH80 <- c(G50,G80)
MH100 <- c(MH80,G100)
MH112 <- c(MH100,G112)

## 確認
MH112
length(MH50)
length(MH80)
length(MH100)
length(MH112)

## 各分布でプロットしてみる
fit112n  <- fitdist(MH112,"norm")
fit112e  <- fitdist(MH112,"exp")
fit112p  <- fitdist(MH112,"pois")

plot(fit112n)
plot(fit112e)
plot(fit112p)


## ポアソン分布に当てはめ
fit112  <- fitdist(MH112,"pois")
fit100  <- fitdist(MH100, "pois")
fit80  <- fitdist(MH80, "pois")
fit50  <- fitdist(MH50, "pois")

## 信頼区間90%(片側5%)
PH112 <- fit112$estimate+qnorm(0.95)*fit112$sd*c(-1,1,0)
PH100 <- fit100$estimate+qnorm(0.95)*fit100$sd*c(-1,1,0)
PH80 <- fit80$estimate+qnorm(0.95)*fit80$sd*c(-1,1,0)
PH50 <- fit50$estimate+qnorm(0.95)*fit50$sd*c(-1,1,0)

## 143試合にして表示
PH112*143
PH100*143
PH80*143
PH50*143

gofstat(list(fit112n,fit112e,fit112p),fitnames=c("Normal","exp","pois"))
正規分布
指数分布
ポアソン分布

離散データなので正規分布や指数分布は無理がある。ポアソン分布でやってみた。範囲を90%区間(5%)で切ってみた。
結果は以下のとおり

村上のホームラン予測

50試合時点からだんだん上がっている。調子がよくなっている。直近のデータからであれば結果はもっと高くなるでしょう。

112試合(8月21日)までのデータから42本~70本。

真ん中で56本。

村上の背番号(55)は超える。

最高で70本は行く。バレンティンも越せる。

範囲をもっと緩く95%区間(2.5%)に代えてみた。

緩め予測範囲

チョー楽観的にすれば72本は行くぞ!!!


いいなと思ったら応援しよう!