Column : 因果推論入門の入門 vol. 2
前回は相関関係と因果関係を正しく認識することが、効果の高いアクションを行う上で大切であるという話をしました。
今回は因果関係と相関関係を間違えないための注意点についてお話しします。
ー因果関係と相関関係の関係ー
相関関係には因果関係と擬似相関の2種類があります。二つの事柄の間に因果関係がある場合には、当然ながら原因によって結果に傾向が生じるため相関関係が現れます。しかし、それらが因果関係にない場合にも何らかの理由で相関関係が生じることがあります。これを擬似相関と言います。
※擬似相関という名前ですが、相関関係はあります。「擬似因果」と呼ぶ方が適切かもしれません。
そのため、相関関係と因果関係を区別するためには、その関係が擬似相関でないかを確認すると良いということです。
ー擬似相関を見抜くにはー
相関関係を目にした際には、以下の3点を疑ってみましょう。
(1)偶然に生じた可能性
(2)第3の変数の存在
(3)逆の因果関係
順を追って具体例を見ていきましょう。
(1)偶然に生じた可能性
実際には関係のないことがらの間に全くの偶然で相関関係が現れることがあります。
例えば、1999~2009年のニコラスケイジの年間映画出演本数とプールでの溺死者数との間には相関関係が見て取れます(相関係数0.67)。しかし、これら二つの事柄に因果関係がないことは容易に分かります。米軍の情報アナリストのタイラー・ヴィーゲンはホームページで、このような”見せかけの相関”の例をたくさん紹介しています。彼のホームページを見ていただければ、偶然に相関関係が生じる例が意外とたくさん存在することが実感できると思います。
(2)第3の変数の存在
学生の学力と体力の間には相関関係がありますが、だからといって(勉強をせずに)運動をさせることで学力が伸びたり、勉強だけしていれば体力が向上するなんてことは考えにくいでしょう。この場合には、どちらの変数にも影響を与える「親の教育熱心さ」や「裕福さ」のような第3の変数が隠れている可能性があります。
前回の例で言えば、メタボ健診と長生きの間には「健康意識の高さ」のような第3の変数の存在が考えられるかもしれません。
(3)逆の因果関係
地域ごとの警察官の人数と犯罪発生率に相関があった場合、警察官を増やしたから犯罪が増えるわけではなく、犯罪が多いから警察官がたくさん配備されていると考えるのが自然でしょう。この場合、「警察官が多い→犯罪が多い」は因果関係の向きが逆になっていると言えます。
言語学の研究では「話が面白くないから相手がきちんと聞かない(話が面白くない→相手が話を聞かない)」という関係だけでなく、「相手がきちんと話を聞かないことで、話し手がうまく話せなくなる(相手が話を聞かない→話が面白くない)」という一見逆向きとも思える因果関係が存在することが明らかになっており、会話における"あいづち"の重要性が見直されているようです。
上記のいくつかの例を見てみてわかることは、擬似相関が生じている場合には原因である(と思われる)事柄を繰り返しても結果を再現することができないということです(ニコラスケイジをハリウッドから締め出してもプールの溺死者は減らないし、子どもに運動ばかりさせても学力は伸びないし、警察官を減らしても犯罪は減りません)。
言い換えれば、因果関係と擬似相関の違いは結果のコントロール性にあるということです。(前回の繰り返しですね。)
今回は因果関係と相関関係を見分けるために注意するポイントをお話ししました。次回は、因果関係を示すために必要となる"反事実"という概念について説明します。
参考
[1]『「原因と結果」の経済学』、中室牧子・津川友介 著、ダイヤモンド社
[2] 『分析者のためのデータ解釈学入門 データの本質をとらえる技術』、江崎貴裕 著、ソシム株式会社
[3] 『統計学が最強の学問である [ビジネス編]』、西内啓 著、ダイヤモンド社
[4]『アルゴリズム思考術』、ブライアン・クリスチャン&トム・グリフィス 著、田沢恭子 訳、株式会社早川書房
[5] Spurious Correlation, http://www.tylervigen.com/spurious-correlations