見出し画像

『人はどこまで合理的か 下』 より 相関関係と因果関係の違いとは

「相関は因果ではない」は、入門統計学で最初に教わることの一つである。だが最初に忘れてしまうことの一つである(トーマス・ソウェル)  

『人はどこまで合理的か 下』より、今回は、相関関係と因果関係の違いについて。ここは哲学にも通じる深い議論で「そもそも因果関係とはなんぞや」という根本的な問題も絡むので大変興味深いところです。

■因果関係は、相関関係の一部

このエピソードで思い出すのは、積極財政派の某経済学者の消費税増税悪玉論で、彼は「消費税を上げるから給与がずっと上がらないんだ」という仮説を主張。

その際「消費税を上げるたびに給与が伸び悩む」というのをグラフでお示しになって「確かにそうだな」と一瞬そのときは思うのですが、どうも釈然としないのです。

私がなぜ釈然としなかったか、今になって改めて考えてみると、相関関係はあっても因果関係として成立しているかどうか、がわからなかったから。

つまり因果関係はあくまで相関関係の一部であって、因果関係=相関関係ではないからです。そして因果関係でなければ仮説としては無意味だから。

本当に消費税増税が給与伸び悩みの直接原因なら、グラフでその相関関係を示すだけでは不十分で「なぜそうなるのか」の説明が必要なのです。

相関関係とは、ある事柄Aとある事柄Bに関係性があるということ。
因果関係とは、ある事柄Aがある事柄Bの原因となっていること。

ある事柄が、ある事柄の原因となっていない場合でも、関係性がある場合もある、ということです。

■相関関係の6つのカテゴリー

例えば、サトマイ著『はじめての統計学(第5章104ー106頁)』によると相関関係は、以下6つのカテゴリーに区分できるといいます。

①事柄Aが事柄Bの直接原因  

→ これが因果関係。
→  事例:寒くなったら厚着する。失恋したら悲しくなる。

②事柄Bが事柄Aの直接原因  

→ 因果関係が逆になっている
→ 事例:地面が濡れているから雨が降ったに違いない
→ 誰かが水道水を地面に撒いたかもしれないので、地面が濡れているからといって雨が降ったわけではない
→必ずしも因果関係ではない

③事柄A・事柄Bが互いに直接原因

→売上(事柄A)の20%を広告費(事柄B)にしている、というような場合
→会計上の「売上」と「変動費」の関係がこれにあたる
→売上と変動費が両方の原因
→これも因果関係

④事柄Aが事柄Bの間接原因

→ 風が吹けば桶屋が儲かる、のパターン
→風が吹く→?→?→ 桶屋が儲かる
 (ちなみに風が吹けば桶屋が儲かる確率は0.8%ぐらいらしい)
→風が吹けば桶屋が必ず儲かるわけではないから、因果関係とまではいえない

⑤第三の変数が両者(事柄Aと事柄B)の原因

→年齢(第三の原因)→ 体重(事柄A)かつ年齢(第三の変数) → 足の速さ(事柄B)
→体重が増えたからといって足が速くなるわけではない
→単なるデブになっただけの場合もある
→必ずしも因果関係ではない

⑥単なる偶然 

→何らかの偶然で、たまたま相関する場合はよくあること
→ちなみに『人はどこまで合理的か 下』では「単なる偶然は相関関係に含まない」としています。
→事例:アメリカの法学生が、ネットで無意味なデータをかき集めたら「メイン州の離婚率はマーガリンの全米消費量と密接な関係にある」という偶然としか考えられないデータの相関を発見。 
 
実は「単なる偶然」には「撹乱変数(交絡)」という厄介な問題もあります。

ⅰ)コーヒー愛飲者に心臓発作が多いことからコーヒーを飲むことは、長年心臓病の原因とされていた
ⅱ)しかし、コーヒーをよく飲む人はタバコもよく吸い、運動不足の傾向もあることがわかった
ⅲ)したがって、コーヒーを飲むのは、は単なる随伴現象(=撹乱変数)でしかなかった(心臓発作の原因は、喫煙&運動不足)

このように、因果関係といえるのは

①事柄Aが事柄Bの直接原因
③事柄A・事柄Bが互いに直接原因

だけで、因果関係とはいえない相関関係はごまんとあるわけです。

ただしピンカー自身は、⑥単なる偶然、以外は、直接的な因果関係とまでは呼べないまでも、現実の世界では因果関係のネットワークの中で、なんらかの形で関係しているかもしれない、と想定しています。

■因果関係は人間の性

これは本ブログで過去に紹介してきた内容と同じで、人間という動物は、何事も因果関係で考えるようにプログラムがセットされている、というエピソード。

したがって事柄Aの後に事柄Bが起きると「何か因果関係があるに違いない、いや必ずある」と思い込んでしまうクセがあるのです。

特に私たちが直接体験できない「神話ゾーン(本書第10章)」においては、架空の因果律を創造して(神話や伝説、宗教の教義など)、偶然(または架空)をあたかも必然のように受け止めることで、自分たちを満足させるのです(皆既日食は悪い兆しに違いない。麒麟が出たら良い兆候に違いない、カラスは神の使い、など)。

■ヒュームによれば「因果関係は幻に過ぎない」

本書でも、多数引用されている哲学者デイヴィッド・ヒュームは、その著作『人性論』の中で、

世の中に因果関係というものはない、ただひたすら、因果関係があると思えるものは私たちが何度も何度も同じことを経験したその経験則に過ぎず、本当の意味での「因果関係」など幻に過ぎない、

といっています。さすがの経験論者ならでは、です。なので

因果関係とは過去に経験した相関関係が未来もそのまま維持されるという期待にすぎない

ヒュームのいう通り、確かに100%の「こうなったら必ずこうなる」というのは幻かもしれない。しかし

数学や物理学の世界では100%の因果関係は成立しているわけで、ヒュームの主張も100%正しいわけではありません。

でも現実の世界ではどうか?と言われると心許ない。

現実の世界では、因果事象は常に一回限りであり、比べることができません。これを統計学では「因果推論の根本問題」[反事実的因果は、直接観察することができないという問題]と呼びます。

別の現実世界がパラレルに存在していていれば、双方で比較対象してどうなるか、比較できますが、現実は一回限り。

更にタイムマシーンのように、もう一回過去に戻ることもできません。

もしかしたら消費増税は、給与が伸び悩んでいる直接原因ではないにしても、なんらかの要因の一つかもしれません。でも過去に戻って消費増税しない状況をモニタリングすることはできないのです。

■それでも因果律は存在する

しかし、100%でないにしろ、現実の世界でも確度の高い因果律は確かに存在しています。

気温が暑くなれば服を脱ぐでしょうし、寒くなれば服をたくさん着る、というのは一部の変わり者?を除けば、ほとんどの人がそうするはずです。失恋すれば誰だって悲しいはずです。

そして、ピンカーに言わせれば「因果推論の根本問題」についても、「ランダム化比較実験」と「自然実験」という合理的実験によって、確度の高い因果関係の説明(=仮説の提案)は、ある程度カバーできるはずだと提言しています。

【ランダム化比較実験(RCT)】

ランダム化比較実験は、無作為抽出実験とも呼ばれ、ターゲットとする母集団から大きい標本を抽出し、無作為に2つのグループに分ける。そして想定される原因を第1グループに適用し〔実験群〕、第2グループには適用せず〔対照群〕、前者が変化するかどうか、後者が変化しないかどうかを見るというやり方。

薬の実験で、実験したい薬候補を服用してもらうグループ(実験群)と、偽薬(ブラセボ)を服用してもらうグループ(対照群)で、その薬候補に効用があるかどうかを調べる、というのが典型的なランダム化比較実験。

【自然実験】

例えば、行動遺伝学では、了解をいただいた一卵性双生児(=遺伝子が同じ)の方に、身体的特徴から性格、各種能力に至るまで、長期間モニタリングして、それぞれの要素が遺伝によるものなのか、環境によるものなのか、その比率を実験で算出したりします。

更に有効なのは、なんらかの都合で赤ちゃんの時から離れ離れになってしまった一卵性双生児で、同じ遺伝子の人が、全く違う環境で育った場合に、環境がその人にどのような影響を与えているのか調査(その結果は以下参照)。

本書では保守派で共和党の考え方に近いケーブルテレビ局、FOXニュースを題材に説明。

1996年にFOXニュースがデビューしたとき、さまざまなケーブルテレビ会社が特に明確な理由もなくこれをチャンネルラインナップに加えました。

経済学者たちはこの偶然を使用し、その後5年間にわたってチャンネルラインナップにFOXニュースが入った街とそうでない街を比べた結果、FOXニュースが視聴できる街では、共和党への投票率が、なんと0.4から7ポイント上がったことがわかったとのこと。

更にケーブルテレビ市場全体でみると、FOXニュースのチャンネル番号が他のニュース番組より低いほど、共和党への投票率が高いことも判明。

このように、現実社会の中で実験群と対照群にできるグループを見つけ、その二つのグループの比較によって因果関係があるかどうか、を検証することができるのです。

■現実の因果関係は巨大なベイジアンネットワーク

現実世界では、100%ではないにしてもある程度の関係性と因果性が、上記のような実験で判明します。実際、科学の世界では、このような統計手法を使って仮説を論文に発表しているわけです。

ただこの世界をマクロ的に俯瞰すると、現実の原因と結果の関係は、ある意味ベイジアンネットワークともいうべき、複数の原因と複数の結果がネットワークのように絡み合って存在しているのではないか、と著者はいいます。

したがって多くの仮説は、複数の原因によって、結果が生じている場合も多く、この場合は、それぞれの要因が、ベイズ推論に基づく複数の原因の確率によって数値化でき、中でも最も影響の高い原因を「主効果」と呼ぶ。

そうはいっても現実社会は不確定要素の塊で、そうそう因果関係が判明する要素は少ないと著者は釘を刺しています。例えば、

160もの研究チームに数千の家族の膨大なデータ(収入、教育、健康記録など)を提供し、6つのライフアウトカム(子供の成績、親の失業の可能性など)との因果関係があるかどうか、最新のアルゴリズムや今流行りの深層学習とうの人工知能など、なんでも使って良いという条件のもとに調査した結果、結論的には明確な因果関係は発見できなかったそう。

この結果も事例に、合理的思考のツールを私たちに紹介した後、最後にピンカーは、

自分たちを取り巻く因果ネットワークはすべて理解できるはずだと思っているわたしたちに、それは自惚れにすぎないと戒めるものでもある。

と結論づけ、合理的思考は重要なツールではあるものの「万能ではない」ということを自覚すべきだとし、暗に「万能ではない」と自覚することも合理的思考の一つであると言っているようにも感じました。


いいなと思ったら応援しよう!