![見出し画像](https://assets.st-note.com/production/uploads/images/128002091/rectangle_large_type_2_7970580e61c4fc94bc48eafcb8cdf913.png?width=1200)
偽相関「統計って深いしオモロイぞ!」
お久しぶりです。
日曜日くらいに更新すると言いながら、しばらく空いてしまい申し訳ございません。まあ、いつの日曜日かとは言っていないのでセーフかもしれませんね。笑
さて、今回のテーマは「偽相関」。
偽相関とは、因果関係がないのに因果関係があるように見えてしまう相関関係のことです。
どういうことか、例を紹介します。
・アイスクリームの売り上げと水難事故の件数
アイスクリームの売り上げが増えると水難事故も増えるというデータがありますが、これは因果関係ではありません。アイスクリームは気温が高い夏によく売れますし、水難事故も夏に起こりやすいです。つまり、気温という第三の変数が両方に影響を与えているので、偽相関が生まれるのです。
・年賀状を出す人の年収と血圧
年賀状を出す人ほど年収が高く、血圧も高いというデータがありますが、これも偽相関です。年賀状を出す人は高齢者の方が多く、高齢者の方が高い役職についていることも多いです。また、高齢者の方が血圧が高くなりやすいです。そのため、年齢という第三の変数が関係しているので、偽相関が生まれるのです。
出典:
https://life-analyze24.com/gijisoukan-example/
なるほど、といった感じでしょう。このように、一見突拍子もない相関関係のように見えても、その構造を深く洞察したら納得できる理由があることが多いのです。
ビジネスにおいても、例えばマーケティング調査などにおいて、利益と相関する変数を見つけた!と思ったとしても、それが偽相関であるか否かをしっかり見極めないとなりません。先の例で言うと、水難事故を減らすためにはアイスクリームの売上を減らせばいい、という考え方は全くの間違いですよね。このように、数値やデータだけに向き合っていると罠にはまるということが大いにありえます。
しかし…
中には、全くの偶然、あるいはその理由がはっきりわからず、推測するしかないような偽相関もこの世界に存在します。
・チョコレートの消費量とノーベル賞の受賞者数
「チョコレートの消費量が多い国ほどノーベル賞の受賞者数も多い」
嘘のようですが本当にあるデータです。もちろんチョコレートの消費量とノーベル賞の受賞者数には因果関係はありませんし、第三の変数も見当たりません。これは奇跡的な、全くの偶然です。このように、たまたま相関があるように見える場合も偽相関と呼びます。
出典:
https://diamond.jp/articles/-/124862
・コウノトリの数と赤ちゃんの出生数
「コウノトリの数が多い年ほど、赤ちゃんの出生数も多い」
というデータがあるそうなんです。コウノトリが赤ちゃんを運んでくるという昔話はありますが、実際にはそんなことはありませんよね。この統計においては、おそらく両方が9か月前の天候と相関しているだけと結論づけられたそうです。つまり、天候という第三の変数が関係している可能性が考えられますが、真相は不明。
出典:
https://ja.m.wikipedia.org/wiki/%E6%93%AC%E4%BC%BC%E7%9B%B8%E9%96%A2
一体どうしてこんな相関関係を見つけたのか、科学者たちの知的好奇心はすごいものです。他にも面白い偽相関をご存知の方がおりましたら是非コメント欄にご記載下さい。
教訓:
・数値やデータだけにとらわれるな!その奥を見ろ!
・統計ってオモロイぞ!