相関と因果の違いを理解しよう!~「相関関係があるけど、因果関係はないよね?」の指摘を攻略しよう~
データ分析をしていると、「これは相関関係があるけど、因果関係はないよね?」と指摘をされることはありませんか?
そんなとき「相関と因果の違いって何だろう?」と思いませんでしたか?
今回は相関と因果の違いについて、具体例を交えて説明していきたいと思います!
相関とは
相関とは、「一方の値が増減したとき、もう一方の値も増減する」という関係性を言います。
左の図は「Aが増えると、Bが増える関係」で正の相関、真ん中の図は「Aが増えると、Bが減る関係」で負の相関と言い、このとき「AとBに関連性がある」と言うことができます。
一方で、右の図はAが増減してもBの増減には影響がなさそうなので、相関があるとは言えなさそうです。
因果とは
では「因果関係にある」とは、どういう意味でしょうか?
因果とは、「Aが原因となりBが起きること、または変化すること」を言います。
言葉だけだと考えにくいので、具体例で考えてみましょう。
相関か因果かを具体例で考えてみる
以下のケースにおいて、相関か因果か、もしくは両方の関係があるのかについて考えてみましょう。
①のケースについては、「気温が上がると、アイスの売上が上がる」は一方の値が増減したとき、もう一方の値も増減するという関係にあるので、相関関係があります。
また、「気温が上がると冷たいアイスを食べたくなる」→「アイスの売上が上がる」ということも言えるので、因果関係もあると言えます。
では②のケースはどうでしょうか。
「気温が上がると、おでんの売上が減る」というのも、相関関係があると言えそうです。
また、「気温が上がると熱いおでんを食べる人は減る」→「おでんの売上が減る」ということも言えるので、因果関係もあると言えます。
最後に③のケースを考えてみましょう。
「アイスクリームが売れるとおでんが売れなくなる」というのは、一方の値が増減したときもう一方の値も増減するという関係にあるので、相関関係はあります。
しかし、「アイスクリームの売上が増えたから、おでんの売上が減った」ということはできるでしょうか?直接的な根拠は言えないと思います。
つまり、因果関係はないです。
まとめると、
①気温が上がるとアイスクリームの売上が増える←相関、因果の両方あり
②気温が上がるとおでんの売上が減る←相関、因果の両方あり
③アイスクリームが売れるとおでんが売れなくなる←相関のみ
このように、相関関係がみられても、因果関係があるのかを確かめないと、誤った分析につながる恐れがあります。
相関と因果を混同することによる失敗
では相関があるのか、因果があるのかを確かめなかったことによる分析の失敗例をご紹介します。
ある会社がサービスの契約率をあげるために過去の顧客データを分析しました。
すると「顧客一人あたりの訪問回数が多ければ多いほど、サービスの契約率が高い」ということが分かりました。そのため契約率を上げるための具体的な施策として、顧客一人あたりの訪問回数を増やすことを実施しました。
しかしその結果、サービスの契約率は上がるどころか下がってしまったのです。
なぜこのようなことが起きたのでしょうか?
これはまさに、相関のみをみて、因果をみなかったことが原因です。
詳しく検証をした結果、実際は「見込み客(自社のサービスに関心があり、近い将来契約の可能性がある顧客)には何度も訪問するようにしていた」ということがわかりました。
つまり、「訪問回数が多いから契約率が高い」のではなく、「契約の見込みがある顧客だから訪問回数が多くなっていた」、ということです。
これでは「訪問回数が多いから、契約率が高くなる」という因果関係を言うことはできません。
このように、相関関係はデータ分析において測りやすい指標であり、物事の関係性を理解しやすいものではありますが、因果関係を考えないことによって、失敗を起こすこともあるのです。
まとめ
相関と因果の違いを理解することで、分析のクオリティは各段に上がります。
実際に、データサイエンティストとして仕事をしていると「これは相関関係があるけど、因果関係はないよね?」という指摘は本当にたくさん耳にします。
その問いに答えることができれば、あなたのデータ分析者としての価値は高くなります。
相関と因果の違いを理解して、質の高い分析を共に目指していきましょう!
【ワークスアイディのホームページはこちら】