仮説検定の種類
を踏まえてまとめる
区分方法
・何を検定するか?
・代表値
・平均
・分散
・中央値
・割合
・度数
・相関
・前提条件は何か?
・パラメトリック/ノンパラメトリック
・正規分布
・等分散
・1群に対する検定か?2群か?3群以上か?
・対応があるかないか?
・検定量はどんな分布に従うか?
z検定
・母分散が既知の場合、z検定が使える
・母分散が未知の場合、t検定を使う
母平均(母分散既知)は特定の値と等しいのか?
2群(母分散既知)の母平均に有意差はあるのか?
母比率の検定
中心極限定理による
母比率の差の検定
t検定
母平均に関する検定
・標本平均の分散が大きいと、差があるとは主張しにくい
・サンプルサイズが小さいと、差があるとは主張しにくい
・3群以上の母平均の差を比較したい場合は、分散分析(ANOVA)を使う
・t検定は連続データに対する検定
・離散データに対しては、カイ2乗検定を使う(期待度数×観測度数の分割表を使う)
母平均(母分散未知)は特定の値と等しいのか?
2群(母分散未知)の母平均に有意差はあるのか?
・対応あり(2標本は1対)
・対応なし
・等分散を仮定できる場合:スチューデントt検定
・等分散を仮定できない場合:ウェルチt検定
※等分散かどうかを判定するにはF検定を使う(P値が0.05以下なら分散に有意差がある)
※両側検定:差があるかどうかを知りたい
※片側検定:大小関係があることを知りたい
χ2検定
・χ2検定は、離散データに対する検定(期待度数×観測度数の分割表を使う)
・ピアソンのχ2検定(独立性検定、適合度検定)
独立性検定:2つの変数は独立しているのか?
・期待度数は帰無仮説「独立している」に基づき計算する
・分割表は、変数Aの取り得る値数×変数Bの取り得る値数
・データ数が少ない時は、χ2分布に近似できないので、フィッシャー正確確率検定を使う
・実務的には、A/Bテストツールを使うことも多い
適合度検定:期待度数と観測度数のズレは偶然か?
・期待度数は帰無仮説に基づいて計算する
・分割表は、変数の取り得る値数×2(期待度数と観測度数)
母分散は特定の値と等しいのか?(1標本)
F検定
2群の母分散に有意差はあるのか?
・2群が正規分布に従うことが前提条件
・母分散比を統計量に使うため、「母分散の比の検定」とも呼ばれる
WMW検定
2群の母中央値に有意差はあるのか?
・WMW検定は観測値の順位のみに着目しているため、母集団がどんな確率分布(双峰な分布、歪んだ分布など)に従っていても使えるノンパラメトリック統計の代表格である
分散分析(ANOVA)
・対応のある(paired, repeated)/対応のない
・繰り返しのある(replication)/繰り返しのない
・N元配置法:比較の切り口の数がN個(職種別、役職別、など)
※対応のある1元配置法=繰り返しのない2元配置法
分析手法のフローチャート
3群以上の母平均に有意差はあるのか?
一元配置分散分析