いまこそ手のひらサイズのデータ分析を
伊藤公一郎(2016)『データ分析の力 因果関係に迫る思考法』。
久しぶりに新書を通読しましたが、「統計学の基礎知識を知っておきたい人は必読」だと思います。これは断言できます。
もっといえば、経済学界隈では言わずとしれた、近年の「計量経済学」あるいは「統計学」の新書における名著です。
「サントリー学芸賞」受賞作でもあります。
スポーツでいえば、年間MVP(野球ならベストナイン、サッカーならベストイレブン)みたいなものです。
前置きが永作博美なので(すべった?)、簡単に振り返ります。
本書のキーワードは、
「RCT(ランダム化比較実験)、RDデザイン、集積分析、パネル・データ分析、境界線、ランダム、バイアス、介入グループ、比較グループ」等が挙げられます。
高校数学までしっかり勉強された方はもちろん、「因果関係」と「相関関係」という「ある事象とある事象」の関係をご存知だと思います。
ただ、「相関関係」と「因果関係」が「異なる」ということまでしかわからず、
「どう異なるか」が説明できる人は、それほど多くないと思われます。
さらに、「どう異なるか」が説明できても、日頃、なんとなく「相関関係」を「因果関係」であると無意識のうちに認知している人は、私を含め非常に多いのではないかと思います。
つまり、データ分析の専門家(でさえ、人間味のある間違いを犯すでしょうけど)以外の、すべての人が、そのような「認知のズレ」を矯正する上でも、本書は有用です。
また、筆者は、シカゴ大学(経済学の世界有数の拠点大学)に勤める大学教授であり、あらゆるデータ分析の研究に携わっているため、本書でも具体的な実例が豊富で学問としても非常に楽しめる内容です。
たまたまですが、私の住んでいる、北九州市で行われた経済産業省や電力事業者と、筆者を含めた研究者で、実際に行われたRCTは、「電力価格の上昇が、節電効果を生むか」という至ってシンプルな問いのもと行われたフィールド実験です。
こちらも、「科学的に因果関係が証明されている」ため、シンプルな問いでありながら、「実験の設計から」非常に洗練されたものであることが読めばわかると思います。
また、いまやUberイーツとして知られるUber社の、「タクシー料金の上昇と需要の関係」を測定した研究は、あの需要曲線を「実際の世界から導いた」、経済学を学んだ人ならワクワクする内容となっています。
筆者は、データ分析の仕事と寿司職人の仕事が似ているといいます。
それはつまり、①素晴らしいネタ(データ)を仕入れること、②ネタ(データ)の旨味を生かせる包丁さばきができること、③目の前のお客さんが求めている味や料理(データ分析の結果)を提供できているのか、という点です。
私は本書を通じて、不細工ながらまぁまぁ食べられる寿司が握れるようになった気がしています。
コロナウイルスや、政権支持率などあらゆるデータがメディアやネット空間に溢れる昨今、必読の新書と言えるでしょう。