見出し画像

ベンフォードの法則が本当に成り立ち、感動!!

先日読んだ「とてつもない数学」を読んで、ベンフォードの法則が成り立つのか気になり、確認してみました。

ベンフォードの法則
 世の中の数値の先頭の数値(1~9)の分布は一様ではなく、
 ある特定の分布になっている

今回調べてみたのは全国の市町村の面積です。データ数が多いし、オープンデータ(※)の取得が可能だったので。

※オープンデータとは以下のいずれにも該当する形で
 公開されたデータの事を指します。
 ①営利目的・非営利目的問わず二次利用可能なルールが適用されたもの
 ②機械判読に適したもの
 ③無償で利用できるもの

今回利用した市町村面積は国土地理院のサイトからダウンロードしました。

過去の面積調(昭和63年以降) | 国土地理院

結果は以下の通り。

全国の市区町村の面積における先頭の数値の出現の割合。
青棒=理論値、赤棒=市区町村面積(2,253データ)。

理論値(青色棒グラフ)と市区町村面積(赤色棒グラフ)は近しい分布になっていますね。なお、データ数は2,253です。
まさか、こんなきれいに当てはまると思いませんでした。

他にも当てはまるのか気になり調べました。
調べたのは、都道府県の人口、歴代映画興行収入(トップ100)、企業売上高(トップ200)。
結果はこちら。

都道府県別人口、映画興行収入、企業売上高における先頭の数値の出現の割合

こちらは理論値とはかけ離れていますね。

ただ、ベンフォードの法則が成り立つケースのうちの1つに、

いくつかの分布から無作為に選ばれた数字の集まり

永野裕之著「とてつもない数学」(ダイヤモンド社)p.219

とあるので、もう少し他のデータも集めて、それらを統合したデータの分布がベンフォードの法則に当てはまるのか確認してみようと思います。
それは、またの機会に。

今日はこのへんで。
最後までお読みいただきありがとうございました。
では、また。

いいなと思ったら応援しよう!