見出し画像

【ざっくリサーチしき #26】 "因果関係"と"相関関係"に対する考え方

ついつい混同しがちな関係性のざっくり知識

ビギナーの方々に、ざっくりとした知識をお届けするシリーズ の第26弾。

因果と相関。この2つについて、意味を説明してもらうと理解できている方は、結構います。

しかし、いざ、リサーチ・データを見せられて説明された時に、きちんと弁別しながら聞き、本質的な理解できているかというと、そうではない方が多いと感じます。

特に、相関関係を、因果関係のように理解してしまう方が多い印象です。

そして、どことは言いませんが、聞き手の曖昧な理解やリテラシーに甘んじて、いい加減なデータ説明や示唆・提案を出す企業や担当者がたくさんいます。

個人的には、プロとして恥ずかしい連中だなと思います。

が、一方で、こういう恥ずかしい連中はこの先も出てきますので、ここは、受け手の方々にも、本当に自分たちをサポートしてくれる企業・担当者と、自分たちの儲けや評価を気にしている企業・担当者を見極める力の1つとして、「相手のデータおよび説明の真偽を見抜く力」は持っておいて頂きたいと思っています。

その力の1つとして、「データや説明の中に現れる因果と相関を弁別できる(指摘できる)」があります。

今回は、因果関係と相関関係について、ざっくり解説します。


因果関係と相関関係を理解する

まず、それぞれを念のため、再度理解するために、シンプルな図で見ておきましょう。

因果関係のシンプルな図
2変数の相関関係の図

因果関係

因果関係というのは、簡単にいうと、

”Aが原因となり、Bという結果が引き起こされた”

という関係性のことです。

「因果がある」というのは、”強力な関係”なので、言い切るには、きちんと精度の高い検証をおこなう必要があります。

逆が成り立たないのはもちろんですが、他にも変数がないか、他の変数との交互作用ではないかなど、色々と検討・検証しないといけません。

因果が証明されると、今後、「AによってBが確実に引き起こされる」ということが前提になりますから、その後の戦略やアクションに大いに活用されます。

もし、それが間違っていると大変な事態になることは容易に想像ができます。

相関関係

相関関係というのは、

”Aがαな状態の時、Bはβな状態が成り立つ傾向がある"

という関係性のことです。

なので、

"Bがβな状態の時、Aはαな状態が成り立つ傾向がある"

と逆にしても、全く問題ありません。

これは、「因果関係」との大きな違いです。

相関関係は、例えば、「Aの値が増えていくと、Bの値も増えていく」という状態・傾向の話をしているだけで、「Aの値が増えることによって、Bの値が”増やされる”」という話は、また別の話です。

以上のように、2つの関係性は、似ているように見えますが、そもそもの「主張が違う」ということが明らかです。


何がややこしくさせるのか?

では、なぜ、勘違いしてしまうのか、そして、不届ものたちが"悪用"するのかというと、

(1) 因果と相関の有無は組み合わせがあり、
  (2) 第三の変数が絡んでいる擬似相関の存在があり、
  (3) 私たちには心理バイアスがあるため、

相関関係を因果関係っぽく説明されたり、第三の変数を説明されずに表面の相関だけで説明されたり、データの組み合わせを「原因と結果のストーリー」っぽく説明されたりすると、なんとなく信じてしまうことになります。

正の相関と因果関係の組み合わせ

勉強時間が増えるから成績が上がるというのは、一見、因果関係のように見えますが、「たまたま成績が上がったから、モチベーションが上がって、勉強時間が増える」ということもありますし、他の生徒も勉強時間を増やしていれば、成績が上がらないこともあります。したがって、因果があるとは必ずしも言えないでしょう。

負の相関と因果関係の組み合わせ

勉強時間が減ったからスマホ時間が増えるというのは、「そういうストーリーにしたい」気持ちはわかりますが、因果関係ではありません。

こういった「こうだったらいいのにな」という気持ちが、データに対する正しい理解と、データ理解に基づいた正しい判断を鈍くさせてしまっています。

擬似相関

一見、とんでもない相関関係に見えますが、どちらも、相関係数という相関関係の確からしさを表す数値は、「非常に高い」例です。

しかし、少し考えればわかるように、「気温の高さ」が1つ目の例の第三の変数、「年齢の高さ」が2つ目の例の第三変数になりますね。

そして、それが説明変数になります。

説明されると、因果も何もなく笑えるかもしれませんが、相関と因果の関係を理解していないと、もう少し込み入った例を出された場合、騙されるかもしれません。

「さぁ、みなさん、チョコレートをたくさん食べましょう!」

こう言われた時、あなたは、どう考えますか?どう返答しますか?



要は、相関関係というのは、あくまで、2つの変数の状態・傾向を見ているだけなので、「どこからか持ってきたデータ同士でも相関係数が高いケース」も、いくらでも出てくるのです。

擬似相関がその例です。

なので、ネット上に無料公開されているデータから、「なんとなく筋が通ってそうな相関関係にあるデータ」を作り出し、悪い気持ちを持って因果関係のように説明することで、相手から自分たちにとって有利な条件や利益を獲得することができます。

上の図を見せられて、「なので、チョコレートをたくさん食べましょう」と言われたら信じてしまうかもしれません。

しかし、「そもそも、国としての話ですよね?そうではなく、個人における因果を示したデータはありますか?」「そもそも、チョコが多く消費できるということは、その国自体が比較的裕福な国であるから、研究にかけるお金があるということではないですか?」「一旦、主張を考えたとしても、チョコレートというのは、どのようなチョコでもいいのか?何か特定のチョコなのか?カカオ成分の高いものと、ほぼビスケットのようなもので、同じ効果があるとは思えないが、どうか?」など、どのような形でもいいので、すぐに信じるのではなく、切り返せる力は持っておきたいものです。


因果と相関の違いを見分けるポイント

最後に、「因果関係にあると、一旦、信用できそうかどうか?」ポイントについて挙げてみましょう。

  • 変数を逆にした場合、成立しないか?

  • データの背景は?(どのような研究で、どのように取得されたのか?)

  • 十分なサンプルサイズか?

  • 因果関係の推定にあたり、用いられている分析手法は?

  • 他の変数による影響は考えられないか?

  • 周辺データは適切に取り扱われているか?


今回は、因果関係と相関関係について、ざっくり解説をおこないました。

ぜひブックマークなどして、必要な時にすぐにチェックできるようにしておいてみてくださいね。

より詳細を知りたい方や、「とはいえ、実践ではなかなか難しい」、実際にリサーチを検討されている方で相談されたい方を、ぜひ、お気軽にお声かけください。

各会社さまとの打ち合わせや報告会の場に、私が同席させていただくサービスなども展開しています。

ご相談は、もちろん無料です!

本記事も読んでいただき、ありがとうございました。


この記事が気に入ったらサポートをしてみませんか?