大数の法則の感覚的ファスト説明を考える
統計の本を読んでいたら、中学校で大数の法則というのを習ったなあと思い出した。当時は「そんなん当たり前だろ」と思ったのだが、厳密に数学的に証明しようとするとちょっと難しい。特に大数の強法則はかなり面倒なようである。大数の弱法則の方はマルコフの不等式⇒チェビシェフの不等式⇒応用のプロセスで証明できるようである。
しかし、数学全般に言えることだが、厳密な論証は難しいし、感覚的でもない。もっと素人でもつかみやすい「ファスト説明」のようなものは無いだろうかと常に考えてしまうのである。数学の証明問題だってきちんと証明すると面倒だが、「見れば分かる」問題だって多いと思う。そういった次元の話である。
平均的な人間の体重を50キロ、標準偏差を10キロとする。この場合、大半の人は50キロ±10キロの範囲内に入っていることになる。
さて、もし100人とか10000人といった大勢の人が集まった場合、体重のばらつきはどうなるだろうか。確率統計の基本的な定理により、期待値は何も考えないで足し算すれば良い。100人の人が集まったら体重の期待値は5トンであり、10000人の人が集まったら体重の期待値は500トンである。
一方、分散の場合はどうか。分散は線形性が成立していないのだが、独立の場合は足し算も可能である。標準偏差が10キロだから、分散は100キロだ。100人の場合の分散は10000キロで標準偏差は100キロになる。10000人の場合は分散が1000000キロで、標準偏差は1トンになる。
さて、一人の人間の体重はだいたい50キロ±10キロだったのに、100人集まると体重はだいたい5トン±100キロであり、10000人集まると500トン±1トンである。なんだか相対的なばらつきはだいぶ少なくなったのではないか。10000人集まった場合はだいたい合計の体重は499から501トンの間に収まることになる。これを一人当たりの体重にすると50キロ±100グラムである!
確かに大数の法則で示されているように、標本数を増やすと平均値のばらつきは小さくなっていくようだ。これは期待値が1乗のオーダーで増えていくのに、標準偏差は2分の1乗のオーダーで増えていくからである。標本数が100万倍になれば標準偏差は1000倍になる。標本数が増えるほど相対的なばらつきはマイナス2分の1乗のオーダーで小さくなっていくのである。この場合、極限を取るとゼロになる。標本数を無限に増やせば平均値の標準偏差は限りなくゼロに近づいていくのである!
さて、この説明に問題はあるだろうか。もちろん大アリである。これは大数の法則の説明としては弱すぎるのだ。標本数の標準偏差が限りなく小さくなっていくことは証明できても、ごく僅かな可能性で標準偏差から乖離した値が出るかもしれない。これでは収束するとは言い難い。
本物の証明ではチェビシェフの不等式が使用される。その前段階のマルコフの不等式もそうなのだが、分布がいかなる形であっても、ある基準値よりも上の値が出る確率が一定以上に絶対にならないということを示しているので、論証は強力である。標本数を増やせば増やすほど、基準値の「天井」は小さくなっていく。これは数列の収束を示すイプシロンエヌ論法そのものである。こうして大数の法則が証明されていくのだが、これでも大数の強法則の証明には弱すぎるらしい。
不等式によって示される制約緩かったとしても、極限を取れば問題はなくなるから、それよりも「天井」があることを示すことが重要ということか。二項定理を使って指数関数の発散が多項式関数よりも急速であることを示す証明を思い出す。
数学の話なのに感覚的な文章ばかりになってしまった。