[書評]統計的因果推論 -モデル・推論・推測

 本書は人工知能で重要な人物であるJudea Pearl教授の著作です。統計学では相関と因果は違うということはよくいわれますが、統計で因果推論をするとはどういうことをするのかについてはあまり話題になっていないと思います。この本を通して、統計的因果推論では何を問題にし、どのようなことが議論されているかを知ることをモチベーションとして読みました。今回は要約をせず、交絡と反事実の概要に絞って書評を書きたいと思います。

 交絡

 交絡とは観測されない因子のことをいいますが、これを統計的に取り扱うとSimpsonのパラドックスが起こります。これは、ある因子を解析に取り込むと2つの変数間の統計的関係が逆転してしまう現象です。例えば、喫煙者が非喫煙者よりも良い成績を取っていているという統計で、
・年齢を調整すれば全ての年齢層で非喫煙者の方が良い成績を取っている
・さらに家族の調整をすれば全ての年齢層で喫煙者の方が良い成績を取っている
という結果が出てしまいます。これは統計をどの変数で調整すべきかが問題になっています。それを判断する手法としてバックドア基準、フロントドア基準が紹介されています。
 この交絡が難しいのは統計的に検証する方法はないからです。しかし、多くの人があると思いこみ、しかもその考えがそれほど間違ってはいないということがあります。これは効果や影響、疑似相関というものが数学的に定義できなかったために起こっています。なぜなら、確率論は静的な条件を扱うものですが、効果を測定するには条件を動かす必要があり、この場合どのような関係が現れるかを予測することができないからです。この予測を行うには因果的、反事実的仮定という外部情報が必要になります。一方で、多くの学者は統計的観点から交絡を定義をしました。なぜならこの定義に依れば結果や影響という用語を使うことなく数学や統計の定義から交絡を検証できる可能性があるからです。この方法は結果的に基準という手法に収束しました。

反事実

 反事実とはDavid Lewisによって提唱された概念です。ある事実に対して、その事実が偽である場合はどうなるかを考えることです。これはベイズの考え方と異なるアプローチです。未来に起こりうる列挙することができれば因果的法則によって考えることができます。近年では反事実機械学習といい、この考え方はAIの分野でも考えられるようになりました。
 因果関係をモデル化することにより因果モデルを作ることができます。これにより反事実を定義することができ、推論をすることができます。反事実の推論には決定論的解析と確率的解析があります。本書ではこれを組み合わせることにより、構造モデルの応用と解釈について説明をしています。

まとめ

 本書は統計的因果推論では重要な著作であり、内容も重厚で読むのが大変でしたが、訳も丁寧で読みやすく、わかりやすいものだったと思います。また、今回交絡と反事実の概要に絞ったのは要約するのは不可能だとかんがえたからです。この用語以外にも重要な考え方や手法が多く紹介されています。

 本書は理論に限らず、実際の統計的問題も多数紹介されており、何が問題になっているかが非常にわかりやすく思いました。また、因果関係の芸術と科学についての話もあり、違った視点から因果について考えることもでき、非常に面白い内容になっていました。

この記事が気に入ったらサポートをしてみませんか?