【読書メモ】西内啓『統計学が最強の学問である』3
読んだ本
読書マインドマップ
読書メモ
第2章 サンプリングが情報コストを激減させる
全数調査とサンプリング調査
ニューディール政策において、正しい失業者数の把握が必要となっ
全数調査かサンプリング調査か?
→サンプリング調査は、驚くほど正確なものだということがわかった
→サンプリング調査は、必要な情報を得るためのコストが激減する
サンプリング調査への「よくある反論」
ランダムに人口の0.5%の人を選ぶ
→その人たちが100%失業者だとしても、残り99.5%が全員失業していなければ、全体の失業率は0.5%にしかならない
→なぜ、人口の100%が失業者などといえるのか?
→全人口1億2000万人の0.5%は60万人
→その60万人が全員失業者である確率は、0.5%の確率で当たりの出るくじを60万回外さずに引くのと同じ確率実際の誤差の計算式は「図表7」(p.51)、サンプル数による標準誤差の推移は図表8(p.53)
→10万人の顧客データを調査したいときは、8,000名をランダムサンプリングすればよい
→それ以上サンプル数を増やしても、標準誤差はさほど変わらない
感想
10万に対して8,000のサンプルを採ればよいので、1割未満の人数の調査で、全体の傾向がわかるということです。全数調査を実施する金銭的・時間的コストが激減します。
問題なのは、サンプリングの方法です。顧客が母集団だと、名簿からランダムサンプリングすることは難しくないと思いますが、日本人を母集団と設定した場合、サンプル数を基準に満たすのと、サンプルを偏りなく採るのは、困難だと思います。
適切なサンプリングの方法も知りたいところです。
最後まで読んでくださった方ありがとうございます。よろしければサポートいただけますと幸いです。本を買い、noteを書き続け、読書文化の輪を広げるために使います。