イレギュラー運航はポアソン分布に従うのか?(検証編)
はじめに
以前、「イレギュラー運航はポアソン分布に従うのか?」という記事を書きました。
この記事の中では理論値と実測値との比較を検定で検証するまでは行っていませんでしたが、統計学の勉強を進めた今、その検定を行える知識がたまってきたので、今回検証を行ってみることにします。
前回のおさらい
前回の記事では、2000年2月から2024年3月までのイレギュラー運航の発生件数を国土交通省のホームページから取得して、日毎の発生件数をまとめていました。その結果は以下のとおりでした。
$$
\begin{array}{|c|c|} \hline
日毎の発生件数(件) & 日数(日) \\ \hline
0 & 5100\\ \hline
1 & 2766\\ \hline
2 & 776\\ \hline
3 & 148\\ \hline
4 & 31\\ \hline
5 & 5\\ \hline
6 & 0\\ \hline
\end{array}
$$
期間全体の日数が8825日(2000年2月1日〜2024年3月31日)で、全発生件数が4911件なので、ポアソン分布のパラメータ $${\lambda}$$ は
$$
\lambda = 4911 / 8825 = 0.556
$$
となり、実績値と理論値を表に並べると以下のようになります。
$$
\begin{array}{|c|c|c|} \hline
日毎の発生件数(件) & 日数(日) & 理論値 \\ \hline
0 & 5100 & 5059.84\\ \hline
1 & 2766 & 2815.42 \\ \hline
2 & 776 & 783.28\\ \hline
3 & 148 & 145.28\\ \hline
4 & 31 & 20.21\\ \hline
5 & 5 & 2.25\\ \hline
6 & 0 & 0.21\\ \hline
\end{array}
$$
検定
適用する検定は「適合度の検定」
今回行うのは、イレギュラー運航の日毎の発生件数にポアソン分布を当てはめた時の適合度の検定となります。
適合度の検定は「カイ二乗分布」を用いて検定を行います。
帰無仮説と有意水準の設定
今回、帰無仮説を
H0 : イレギュラー運航の日毎の発生件数はポアソン分布に従う。
とします。また、有意水準は$${p=0.05}$$で検証します。
今回の場合、カテゴリーは7つ(0件〜6件)で、さらに$${\lambda}$$を実績値から算出したので、自由度5のカイ二乗分布によって検定を行います。
検定統計量の算出
すでに理論値と観測値の度数分布表は作成したので、カイ二乗検定統計量を算出します。算出したp値は10.64となりました。算出は以下の式のとおりです。
$$
\begin{array}{lll} \chi^2 &=& \displaystyle\sum_{i=1}^{k}\dfrac{(O - E)^2}{E} \\\ &=& \dfrac{(5100 - 5059.84)^2}{5059.84}\\ &&+ \dfrac{(2766 - 2815.42)^2}{2815.42}\\&& + \dfrac{(776 - 783.28)^2}{783.28} \\&&+ \dfrac{(148 - 145.28)^2}{145.28} \\&&+ \dfrac{(31 - 20.21)^2}{20.21}\\&& + \dfrac{(5 - 2.25)^2}{2.25} \\&&+ \dfrac{(0 - 0.21)^2}{0.21} \\\ &=&10.64 \end{array}
$$
カイ二乗分布表との比較と結論
自由度5、$${\alpha = 0.05}$$の上側確率のp値をカイ二乗分布表から求めると11.0705です。
上の計算で求めた検定統計量は10.64でした。11.0705と比較し小さいため、帰無仮説は棄却されません。したがって、「イレギュラー運航の日毎の回数はポアソン分布に従っていないとは言えない。」ということになります。
今回の検定を図示
今回行った検定を図示すると以下のとおりです。
以上で「イレギュラー運航はポアソン分布に従うのか?(検証編)」を終わります。