『数字のセンスを磨く』内容(ちょっとだけ)紹介(「因果」の章)

前々回は『数字を磨くセンス』第一章(数量化)、前回は第二章(比較)について少しだけ紹介しました。今回は第三章(因果)についてです。

数量化のところでも比較のところでも、「そろえる」ということが重要な意味を持つことを強調しました。因果、特に因果推論(causal inference)と呼ばれる統計学の手法では、この「そろえる」という作業をできるだけ突き詰めることが必要になります。

しかし、なぜ因果推論、すなわち特定の介入=処置が効果を持ったかどうかを考える上で、「そろえる」ことが重要な位置を占めるのでしょうか?

丁寧に説明すると長くなるのですが、簡単に言えばこうです。たとえば開発されたワクチンに効果があるかどうかを調べたいとします。このとき、「ワクチンを打った人」と「打たなかった人*」でその後の感染率や重症化率などを比較するのですが、このとき、「打った人=処置群」と「打たなかった人=統制群」ができるだけ均質であることが好ましいのです。

*実際には、<何か>を「打った/打たなかった」ということ自体が被験者のその後の行動に影響する――たとえばワクチンを打ったと思った人が安心して感染リスクの高い行動を取るなど――ことが考えられるので、偽薬(プラセボ)を打ちます。

なぜなら、処置群と統制群がそもそも異なった性質を持った集団(たとえば年齢層が違う、行動特性が違う、など)である場合、その後の感染率に群間の差が出た場合、それがほんとうにワクチンの効果なのかがわからなくなるからです。

処置群と統制群を均質化するためには、しばしば無作為化、つまりランダムに割り振ることが行われます。こうすることで、年齢や性別以外の観察しにくい要素のみならず、未知の要素も均質化することができるからです。

ちなみに、「ワクチンが打ちたい人が打つ」ようにすると、処置群に「感染症に対して敏感な人」が多く含まれるなどが考えられ、そうするとこういう人たちはワクチンを打っていなくても慎重に行動するでしょうから、感染率が低く出て、ワクチンの効果を過大評価してしまう可能性があります。処置をするかどうかを自分で決めることを「自己選択」といいますが、実は統計的因果推論は自己選択との戦いという側面も持っています。調査票調査(アンケート調査)は、実験データと違って原則的に自己選択の観察データですから、調査観察データで因果推論を試みるにはかなりのテクニックが必要になります。

処置のジレンマ

ただ、因果推論でもいろいろ気をつけるべきことがあります。本書では、次のような懸念事項があると書きました。

まず、因果推論で効果が測定しやすいのは、原因が処置として考えやすいものだ、ということです。「ワクチン→感染抑止」という因果におけるワクチンは、処置として独立して実施しやすいものだと思います。これが「児童手当→出生力上昇」になると、財源の配分に影響して副次的に出生力に影響する回路を塞がない限り、首尾よく効果が予測できないかもしれません。

ただ、手当や規制の導入は、まだ因果推論にとって相性が良い方だと思います。これが「学歴」になると、とたんに難しくなります。理由は二つで、ひとつは「児童手当を増やす」のと同じように「学歴を動かす」ことは、実際上非常に難しいということです。無理に動かしても、学歴と同時に動いてしまうものが多すぎて、社会全体が変化してしまうかもしれません。

さらに、「他のすべての状態が同じ二群で、学歴だけが違う」ということを定義することが非常に難しいという意味的な問題もあります。というのは、ワクチン接種や児童手当と違って、学歴は複合的な概念であり、他の概念・要素とある部分は緊密に、ある部分では緩やかに絡み合っているからです。学歴は、能力、資格、肩書、ネットワークなどと絡み合ったところに存在する特性であって、それ自体を独立して動かすことを意味的に理解することができません。

因果推論でいう「処置」とは、要するに、他の要素から独立してそれ自体を動かすことが意味を持つもの、ということです。ですので、学歴、結婚など複合的な変数については、うまく適用できないか、できたとしてもそれはすでにもとの意味での学歴、結婚とはかけ離れたものになってしまいます。

本書では、この現象を処置のジレンマと呼んでいます。

結婚の例でいえば、「出生力低下の主要因は結婚が減ったことにある」という言明は、「結婚を何らかの介入で増やせば出生率が上がる」という因果推論的な言明とはずいぶん違うのです。実際の社会において結婚という概念には厚みがありますから、独身時代から続く生活・職業の安定といった要素が結婚に結びつきやすいとすれば、より多くの人が結婚できるようにする」というのは、そういった生活環境をも含んだ言明なわけです。学歴と同じで、結婚はそれだけを切り離して増やすとか増やさないとか、そういう図式では捉えにくいイベントであると言えます。

次回は、確率の章を紹介します。

いいなと思ったら応援しよう!