統計学が最強の学問である (西内 啓)
(注:本稿は、2013年に初投稿したものの再録です)
とても話題になっていますね。以前から統計学には興味をもっていたので、楽しみに読んでみた本です。
タイトルづけも上手ですね。内容も、数式はほとんど登場せず、初心者に対する分かりやすさを意識した書きぶりなので、統計学の基礎レベルの予備知識があれば十分理解できると思います。
そういった本書の中で、特に私の関心を惹いたところをいくつかご紹介します。
まずは、「サンプリングが情報コストを激減させる」という章で、最近、大流行の“ビッグデータ”の統計学的意味に言及しているくだりです。
著者の考えは、目的を明確にすれば、統計学的手法によるサンプリングデータの分析により、ビッグデータ(全数)処理と同等の判断材料を極めて安価に得ることができるというものです。
統計学的手法は稼動もコストも圧縮できます。著者からみると、施策の是非に関する机上議論をあれこれ延々と行っている状況は極めて非生産的なものに映ります。
とやかく言うぐらいなら、サッサと統計的手法(ランダム化比較実験)により試してみて、その結果で判断すればいいのにとの考えです。
ちょっと本筋がから逸れますが、この点で私が思うのは「『判断』は『決断』である」ということです。
決断は、それが間違っているかもしれないというリスクを包含したものです。リスクテイキングが決断の一つの側面である以上、決断するための判断材料に完璧を求めることは無意味。100%の情報が得られれば誰でも正しい決断ができる、30%程度の情報から採るべき道を示すのがリーダーです。
統計学的思考は、より正しい判断を下すために極めて重要な要素です。昨今のICTの急速な発展により、ビッグデータに象徴される大規模データの統計処理やデータマイニング・テキストマイニングといった分析も至極簡易にできるようになってきました。
私たちの身の回りには、「数字」を用いた主張・説明が溢れています。
政府が発表する各種統計数値、マスコミによる世論調査やTVの視聴率、携帯電波のつながりやすさ・・・、それらの数字をどう解釈するか、そもそもその「1%の差」には意味があるのか・・・。
本書の大半は統計的手法の概説で占められていますが、本書で著者が伝えたかったことはそれに止まりません。
日常の社会生活の中で、私たちが目にする様々な数字が発するメッセージを正当に「解釈」し「評価」することが大切であり、そして、そのためには「統計リテラシー」を高めることが必要があること、この2つの指摘が著者からのメインメッセージだと思います。