
Vol.72 結果が逆転?_シンプソンのパラドックス
(2023年2月)
金融ソリューションチームコラムの第72弾をお届けいたします。
今回は、データ分析をするうえで注意していただきたい、統計学で有名な”シンプソンのパラドックス”についてご紹介します。
これは1951年、統計学者E.H.Simpsonが提唱したパラドックスです。
母集団の相関と、母集団を分割した集団の相関は一致しないことがあるというパラドックスで、簡単に言うと「分析のやり方次第で異なる仮説が成り立つ」ということです。
例を用いて説明します。
個人年収300万以下の低所得顧客90人と個人年収1000万円以上の高所得顧客110人からの評価をもとに、担当者A・Bの2人の顧客満足度調査を行うとします。担当者Aは低所得顧客80人・高所得顧客20人を担当し、Bは低所得顧客10人・高所得顧客90人を担当していたとします。
低所得層からの担当者Aの満足度は60% (48/80)、Bの満足度は50%(5/10)でした。
一方、高所得層からの担当者Aの満足度は75%(15/20)、Bの満足度は70%(63/90)でした。
一見すると担当者Aは両方の層から支持を受けており、Bよりも優秀であるかのように見えますが、2つの層の人数を足して満足度を測ったところ、担当者Aの満足度は63%(63/100)、Bの満足度は68%(68/100)となり、「担当者Bの方が顧客から評価されている」という見方ができてしまいます。
担当者A 担当者B 計
低所得層 48/80 > 5/10 53/90
高所得層 15/20 > 63/90 78/110
計 63/100 < 68/100
このように、全体から特性を分けて割合を算出すると、結果が逆転することがあります。視点を変え、担当者別ではなく所得別で見てみると、低所得層の担当者に対する満足度は58%(53/90)、高所得層の満足度は70%(78/110)と差があることが分かります。担当者Bは満足度の高い高所得層をAよりも多く担当していたため、高所得層の影響を強く受けたのです。
全体の集計結果を分割したことによって、全体からでは見えなかった結果が得られることもある一方で、部分的な解釈から全体を捉えることもできません。全体の傾向を見ることは重要ですが、施策を打つ際はセグメントを分けて分析することをおすすめいたします。
調査の設計や結果の分析についてお困りの方はお気軽にご相談ください。
■今週の執筆者■
片岡 龍太郎(ソリューション本部 アカウント第1部)
【お気軽にメールにてご意見、ご要望いただければ幸いです】
日経リサーチ 金融チーム finsol@nikkei-r.co.jp
当コラムの無断転載、引用は固くお断りいたします。また、執筆者個人の主観、意見が含まれております、ご了承ください。