適合度の検定と独立性の検定
適合度の検定と独立性の検定は、共にカイ二乗検定の一種です。
適合度の検定(1変数)
特定の理論的分布への「当てはまりの良さ」を判断するために、観測頻度と期待頻度の一致度を調べる。
ばらつき(分散)を調べることでもあるので、カイ二乗分布を使用する。
例:毎日同じ個数の卵を産むと想定されるうずらが、曜日によって産卵数に違いはあるか
例:1日の死亡者数がポアソン分布にそっているか(パラメータλを推定した場合、自由度はn-2)
$${\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i}}$$ (自由度は(n-1))
$${E_i}$$にはそれぞれのカテゴリの期待値(全て同じ期待値の場合も、そうでない場合もある)を入れる
独立性の検定(2変数)
2変数以上が互いに独立であるか、関連性があるかどうかを調べる。
例:性別(男性、女性)と喫煙者か非喫煙者かという属性の間に関連性があるかどうか
$${\chi^2 = \sum \frac{(O_{ij} - E_{ij})^2}{E_{ij}}}$$
自由度は((r-1)×(c-1))