
テレビの視聴率調査って全国5400万世帯のうちたった1000世帯だけでいいの?
こんにちはKamaniwaです。今日は仕事中にふと気になってしまったことがありそれを記事に留めておこうと思います。
国立社会保障・人口問題研究所(http://www.ipss.go.jp/pp-ajsetai/j/HPRJ2018/t-page.asp)によれば2019年における総世帯数は現在約5400万世帯があるそうです。この世帯ほぼ全てにテレビが設置されているという仮定で進めさせていただきます。
テレビの視聴率の調査方法ですが、無作為に選んだ1000世帯ほどで全体の5400万世帯の視聴率を推定しているそうです。つまり1世帯の見ている番組を「5万4000世帯が見ている」として調査しているわけです。果たしてそれで本当に5400万世帯の実態と一致する調査が行えているのか・・・?
今回の検証を進めていきます。
まず割合ですが、
どの番組も見てない世帯:50%
Aテレビを見ている世帯:30%
Bテレビを見ている世帯:10%
Cテレビを見ている世帯:7%
Dテレビを見ている世帯:3%
と勝手に決めました。
次にExcelに以下の数式で1000行作ります。
ランダムで1~5400万の乱数を作る数式です。
=RANDBETWEEN(1,54000000)
で、これを以下のCOUNTIFSでカウントします。
3%の要素:
=COUNTIF($A$1:$A$1000,"<=1620000")
7%の要素:
=COUNTIFS($A$1:$A$1000,">1620000",$A$1:$A$1000,"<=5400000")
10%の要素:
=COUNTIFS($A$1:$A$1000,">5400000",$A$1:$A$1000,"<=10800000")
30%の要素:
=COUNTIFS($A$1:$A$1000,">10800000",$A$1:$A$1000,"<=27000000")
50%の要素:
=COUNTIF(A5:$A$1000,">27000000")
とするとExcelの見え方はこんな感じになります。
で、20回ほど実施した結果が以下ですが、
つまり結果は以下のようになります。
試行回数が20回なので根拠としては弱めのデータですが、一応体感的なイメージとして
3% → 1.6%~3.7%
7% → 5.3%~9.1%
10% → 8.4%~12.1%
30% → 28.1%~31.7%
50% → 47.6%~53.1%
となりました。
結論、まあ大体合ってる。
いや、5400万件のデータのうち、1/54000であるたった1000件を取り出すだけでこれだけ推定できるのだから大したものだと思います。
今回は以上です。