母集団と標本【統計学をやさしく解説】
↓↓↓動画で見たい方はこちら↓↓↓
この記事の主な内容
母集団と標本とは
統計学の基礎となる重要な考え方の一つとして、母集団と標本があります。母集団とは統計分析をしたい事象に関わる全ての対象の集団のことです。対して、標本とは母集団の部分集合です。簡単に、母集団の一部であると考えられます。例えば、日本人男性の平均身長を知りたいとします。このとき、母集団は日本人男性全員であり、標本はその一部です。標本は様々な決め方が考えられます。職場にいる男性や友人の男性、東京都在住の男性などが標本として考えられます。この記事では、母集団と標本を用いた調査の方法やそれらの活用を解説します。
全数調査と標本調査
日本人男性の平均身長の例を再度考えてみましょう。このとき、母集団全体である日本人男性全員の身長を計測することが最も確実です。このように母集団全体の数値を用いて調査することを全数調査と呼びます。時間や費用が膨大である反面、誤差なく知りたい結果が分かる点が全数調査のメリットです。全数調査の例として、国民全員の世帯に関するデータを集める国勢調査が挙げられます。
ただ、6000万人余りの身長を計測して平均値を出す作業は膨大な時間を要するため現実的ではありません。そのため、母集団の一部である標本を用いて調査することが一般的です。この調査のことを標本調査と呼びます。世の中で行われる調査のほとんどはこの標本調査であり、内閣の支持率調査やテレビの視聴率調査などが標本調査に該当します。
一般的に全数調査の手間や費用は大きくなることが多いものの、調査内容によってはこの限りではありません。狭い範囲の対象のみに関心のある場合、母集団の数が少なくなります。クラスの生徒の平均身長や同僚の食堂の利用率であれば容易に全数調査を行うことが可能です。また、データが捕捉しやすい場合にも全数調査が行えます。模試では全員の答案を採点しているため、集めた点数から平均や標準偏差、順位などの統計量が得られることが多いです。また、フランチャイズ企業の利益なども容易に全数調査を行うことができます。このため、調査の方法はその手間と精度を天秤にかけて決めることが重要です。
標本調査の注意点
前のセクションでは標本調査は手軽に行える反面、全数調査と比較すると精度が落ちると説明しました。では、具体的にどのような問題点が挙げられるのでしょうか。
はじめに、標本調査では標本の選び方が非常に重要になります。例えば、平均年収を推測することを目的とした標本調査で、三菱商事に勤める会社員を標本としてしまっては問題が生じます。企業によって給与水準は異なるため、この場合過度に高く平均年収を推定してしまいます。このため、多くの標本調査では母集団からランダムに標本を選ぶ無作為抽出という方法を用いています。無作為抽出を行うことによって、標本のバイアスが軽減されます。
次に、標本の数も重要です。標本の数が多ければ多いほど標本の性質は母集団に近づきます。例えば、身長の調査をしていて3人の標本を用いるのでは不十分です。なぜなら、平均身長が偏ってしまうことが考えられるためです。たまたま身長が低い人を3人選んでしまったり、高い人を選んでしまった場合の誤差がとても大きくなってしまいます。標本の数を増やすことで母集団の平均などの数値がより正確に推定できるという性質を大数の法則と呼びます。
母集団と標本の活用
統計学のなかで、標本から母集団の性質を推測する学問を推測統計学と呼びます。推測統計学では、標本のデータを用いて母集団の特徴を予想する推定と母集団についての仮説を検証する検定という二つの方法が頻繁に用いられます。母集団の平均を推定したい場合であれば具体的な数値を求める点推定や平均がどの範囲に属するか予想する区間推定といった異なる方法があります。母集団と標本の関係を理解することは統計学への第一歩です。ぜひこの機会に習得しましょう。
統計学、データ分析、数字力、数学などが学べる各種無料講座を開催しています。お気軽にご参加ください。セミナー一覧はこちらより⇒「和からのセミナー一覧」
●お問い合わせフォームはこちら
<文/須藤>
この記事が気に入ったらサポートをしてみませんか?