標準誤差とは
いまさらですが、「標準誤差」について。
↓↓の書籍を進めていくなかで、学びにつながった項目を一つずつ取り上げていきます。
「標準誤差」の説明がとても分かりやすかったので。まとめてみます。
標本データがある。本当は母集団(全購買者)のアンケート調査結果を得たい。
しかしそれは不可能なので、標本データ(一部のデータ)から母集団の結果を推定する。
標本データの平均値が4.38だったとする(100人分の値を合計し、100人で割った値)。
これは母集団のデータではない。
なのでこの結果に”誤差の範囲”を加味する必要がある。
その”誤差の範囲”が標準誤差。
それを加味して「母集団の平均値はこのくらいになる」と推定できる。
$$
{標準誤差} = \frac{\text{データのばらつき}}{\sqrt{\text{データの個数}}}
$$
このケースで標準誤差を計算すると0.06。
よって、母集団の平均値は、4.38 ± 0.06 の範囲と推定される。
標準誤差を「平均値の推定精度」とされていて、この表現も分かりやすい。
「基礎から学ぶ統計学」では
p.121に解説されている。
統計検定2級対策をしていると「標準誤差」という用語自体を目にする機会が少ないため、いつまでも用語のイメージをもつことができなかった。
標準誤差とは、標本分布の標準偏差であり、
標本平均 x̄ の標準誤差は、標本平均の標本分布の標準偏差、ということになる。
$$
\text{標準偏差} :\frac{\sigma}{\sqrt{n}}
$$
単純に、「標準誤差=標準偏差(標本において)」と解釈してしまってよいかを chatGPT に壁打ちして確認。
chatGPTに壁打ち
$$
SE_{\bar{x}} = \frac{s}{\sqrt{n}}
$$
chatGPT からは「適切な表現ではない」「それらは明確に異なる統計的概念」と指摘されてしまったが、それは重々承知している。
あくまでも、私が「標準誤差」を理解する際の捉え方。ただこの辺りの解釈は混乱につながりかねないので、人に説明できるようにはしていきたい。
この記事が気に入ったらサポートをしてみませんか?