標的集団パラメータと帰無仮説と帰無分布

統計的推測でとてもややこしい所、それは、帰無仮説は標的集団パラメータについての設定であるのに対し、帰無分布は標本分布を指す、という事です。

まず、着目する大元の集団、つまり標的集団から要素を無作為に得られると考えると、その要素は特定の確率分布に従っている、つまり確率変数であるとみなせます。これが大前提です。

次に、帰無仮説とは、着目する標的集団パラメータがパラメータ空間に属する特定の値である、というような仮説です。パラメータ空間とは、パラメータが取り得る値の集合です。

標本分布は、標的集団から得た大きさnの標本から構成される関数、つまり標本統計量が従う確率分布です。ここで標本の要素は、独立に同一の確率分布から得た確率変数の集まりです。当然、要素を抽出する対象の確率分布は、標的集団を表現する分布です。また、標本統計量そのものが確率変数です。標本平均などがよく使われます。
そして、統計的仮説検定の文脈では、帰無仮説が成り立っている、つまり標的集団を表現する確率分布のパラメータがパラメータ空間内のこの点である、との仮説のもとで、そこから得た標本から構成した統計量が従う分布を帰無分布と言うのです。検定の文脈における標本統計量を特に、検定統計量と言います。

要するに、同じ帰無の語がついていますが、帰無仮説のほうは、標的集団の確率分布の形状を決めるパラメータに対する仮説的の主張であり、帰無分布は、帰無仮説下での標的集団から得た標本から構成する統計量(検定統計量)が従う確率分布を指すのですね。帰無分布自体は、標的集団についての直接的な表現では無い訳です。

おそらくここは、統計学を勉強し始めた時に最もつまずきやすい所ではないかと思います。
帰無分布なる語自体を使わないテキストも多いです。場合によっては使わないほうが良いかも知れませんし、使うなら、それが標本分布を指す事をきちんと説明すべきでしょう。

そもそも、標本分布の語がものすごく解りづらいですけれども。

この記事が気に入ったらサポートをしてみませんか?