統計的仮説検定入門2
7.2標本の差のz検定
2つの母集団の母平均に差があるか否かを検定したいことは多いだろう。
たとえば新薬の効果と旧薬の効果を比較する際、標本平均では新薬のほうが大きくても、両者の母平均の大小までは直接はわからない。我々人間は、これから薬を飲むであろう無数の人々に対する薬効(母集団)の期待値を知る由もないからだ。
したがって我々は統計的仮説検定を行わなくてはならない。
問1 教育プログラムAを受けたサンプルとBを受けたサンプルを用意する。それぞれのサンプルサイズは25人と30人であった。両方のサンプルに同じ試験を受けさせて点数を記録した。標本平均はそれぞれ62点と65点であった。このテストを受ける際のプログラムA・プログラムBの母集団はどちらも分散5^2の正規分布に従うとする。
これらのサンプルを元に、教育プログラムAを受けた母集団と教育プログラムBを受けた母集団の期待値に差があるかどうか有意水準5%で検定せよ。
(1)帰無仮説と対立仮説を設定せよ。
(2)帰無仮説が真である場合、(Aの標本平均)ー(Bの標本平均)が従う分布、即ち帰無分布を求めよ。ヒント:まずAの標本平均の分布とBの標本平均の分布を考える。そのあと、正規分布の再生性を用いる。
(3)p値を求めよ。
(4)p値と有意水準を比較せよ。
(5)帰無仮説を棄却するか否か判断せよ。必要に応じて対立仮説を採択せよ。
問1(2)の解説
Aの標本平均とBの標本平均はそれぞれND(μA,25/25),ND(μB,25/30)に従う。
したがってAの標本平均-Bの標本平均は正規分布の再生性定理より、正規分布に従う。その期待値は期待値の線形性よりμA-μBとなり、分散は共分散の線形性より COV[Aの標本平均-Bの標本平均,Aの標本平均-Bの標本平均]=V[Aの標本平均]+V[Bの標本平均]=25/25+25/30となる。Aの標本平均とBの標本平均が独立なのでCOV[Aの標本平均,Bの標本平均]=0となるのを使った。
すなわち
Aの標本平均-Bの標本平均〜ND(μA-μB,11/6)
であるが、帰無仮説が真ならばμA-μB=0となり、
Aの標本平均-Bの標本平均〜ND(0,11/6)
となる。これを書き換えれば
(Aの標本平均-Bの標本平均)/√(11/6)〜z分布
となる。
この結果を覚えるのではなく、(1)〜(5)のプロセスを素早くなぞることができるようになることが肝要だ。
問2 教育プログラムCを受けたサンプルとDを受けたサンプルを用意する。それぞれのサンプルサイズは20人と30人であった。両方のサンプルに同じ試験を受けさせて点数を記録した。標本平均はそれぞれ69点と65点であった。このテストを受ける際の母集団は分散5^2の正規分布に従うとする。
プログラムCは非常に高額であるため、プログラムDに比べて母平均が3点以上高くなっていないと割に合わない。
そこでこれらのサンプルを元に、教育プログラムCを受けた母集団と教育プログラムDを受けた母集団の期待値の差が3以上あるかどうか、有意水準5%で検定せよ。
8.母分散が同じ2つの母集団の、期待値の差に関するt検定
2つの母集団の差について検定を際、母分散がわからないことがほとんどである。その際は前の記事で解説したときと同様、母分散の代わりに標本不偏分散を用い、z分布の代わりにt分布を使う。
2つの母集団の母分散が等しいと仮定できる場合、母分散の不偏推定量は
すべての標本の偏差平方和/(サンプルサイズ合計-2)
である。
問3 教育プログラムAを受けたサンプルとBを受けたサンプルを用意する。それぞれのサンプルサイズは25人と30人であった。両方のサンプルに同じ試験を受けさせて点数を記録した。標本平均はそれぞれ62点と65点、標本不偏分散は4^2と4.5^2であった。このテストを受ける際の母集団は分散が等しい正規分布に従うとする。
これらのサンプルを元に、教育プログラムAを受けた母集団と教育プログラムBを受けた母集団の期待値に差があるかどうか有意水準5%で検定せよ。
(1)帰無仮説と対立仮説を設定せよ。
(2)帰無仮説が真である場合、t検定統計量=((Aの標本平均ーBの標本平均)-0)/√(s^2/25+s^2/30)が従う分布は自由度25+30-2のt分布である。ただしs^2は母分散の不偏推定量である。s^2を求め、t検定統計量を求めよ。
(3)p値を求めよ。
(4)p値と有意水準を比較せよ。
(5)帰無仮説を棄却するか否か判断せよ。必要に応じて対立仮説を採択せよ。
9.母分散が異なる2つの母集団の、期待値の差に関するt検定(Welchのt検定)
では、母分散が同じであると仮定できない場合はどうするのだろうか?
その疑問に答えるために、まずは以下の問題を考えてみてほしい。
問1改 教育プログラムAを受けたサンプルとBを受けたサンプルを用意する。それぞれのサンプルサイズは25人と30人であった。両方のサンプルに同じ試験を受けさせて点数を記録した。標本平均はそれぞれ62点と65点であった。このテストを受ける際のプログラムA・プログラムBの母集団はそれぞれ母分散3^2,5^2の正規分布に従うとする。
これらのサンプルを元に、教育プログラムAを受けた母集団と教育プログラムBを受けた母集団の期待値に差があるかどうか有意水準5%で検定せよ。
(1)帰無仮説と対立仮説を設定せよ。
(2)帰無仮説が真である場合、(Aの標本平均)ー(Bの標本平均)が従う分布、即ち帰無分布を求めよ。ヒント:まずAの標本平均の分布とBの標本平均の分布を考える。そのあと、正規分布の再生性を用いる。
母平均がわかっていない母集団に対して、個々の分散がわかっているというのは奇妙な状況であるが、この状況で(2)まで考えてほしい。
すると、
(Aの標本平均)-(Bの標本平均)〜
ND(μA-μB,(Aの母分散/Aのサンプルサイズ)+(Bの母分散/Bのサンプルサイズ))
すなわち
{((Aの標本平均)-(Bの標本平均))-(μA-μB)}/√(Aの母分散/Aのサンプルサイズ)+(Bの母分散/Bのサンプルサイズ)) 〜ND(0,1)
となることが分かるだろう。
しかしながら、Aの母分散とBの母分散がわからない場合はどうすればよいだろうか。しかも2つの母分散が同じであるかどうかもわからない。
そこで、例によってAの母分散とBの母分散をそれぞれの標本の不偏分散で代用したものをt検定統計量とする。
ただし、このt検定統計量が従うt分布の自由度は非常に複雑である。
覚える必要はないが、一応近似式を掲載しておく。
df≒(Aの不偏分散/nA+Bの不偏分散/nB)^2/{Aの不偏分散^2/(nA^2(nA-1)+Bの不偏分散^2/(nB^2(nB-1)}
この検定をWelchのt検定と呼ぶ。
謝辞
このnoteはピースオブケイク社での統計勉強会のために作成した資料です。勉強会での講師の機会をくださった参加者のみなさまに感謝申し上げます。