「因果推論の科学 「なぜ?」の問いにどう答えるか」書評
はじめに
人工知能研究者であるジューディア・パールにより執筆された「因果推論の科学 「なぜ?」の問いにどう答えるか」を紹介したいと思います。
この本は、2018に出版された「The book of Why: The New Science of Cause and Effect」の翻訳本として2022年9月に出版されました。
筆者であるジューディア・パールは、イスラエル人の人工知能研究者で、確率的および因果的推論を発展させることで、人工知能に貢献をしたとして2011年にコンピュータ・サイエンス分野におけるノーベル賞と言われるチューリング賞を受賞しています。[1]
この本では、因果推論の歴史上での取り扱い、筆者のAI関連の研究活動であったベイジアンネットワークの話、社会的な議論となったタバコと健康の因果解析の話、そして因果関係を解析する上で避けて通れない交絡因子、介入、媒介因子、反事実などについて述べられています。
本書を読んでの印象
読み物となっているため、初学者とってはとっつきやすい形式となっています。しかし下記の観点で読み切るには忍耐力が必要な本となっています。
・ページ数が多い(564ページ)
・話があっちこっちに飛ぶ。
因果ダイアグラムの手法の説明が出てきたと思ったら、統計学で有名なパラドックスの話がでてきたり、あまり本筋と関係ない著書の専門であるベイジアンネットワークの話がでてくるなど、テーマに一貫性がない。。
また因果推論の手法である因果ダイアグラムについて説明がされていますが、わかりずらく、純粋に因果ダイアグラムを知りたいという方は同じ筆者が執筆した「入門 統計的因果推論」を読むことをお勧めします。
オススメ対象読者
というわけでオススメの対象読者は下記になります。
・因果推論の歴史上の取り扱いを含めて、全体概要を知りたい人
仕事ですぐに因果推論を役立てたいという人にはあまりお勧めできません。
概要紹介
ではここからはこの本の概要について説明したいと思います。
要点を伝えるため、記載の順番は本書を無視しており、その点はご了承願えればと思います。
1. 因果関係の問い
世の中にはその因果関係を明らかにしたい事象で満ち溢れています。
例えば
① 治療薬Aは、疾患Bの治療に有効か
② 売上が上がった原因は何なのか、広告の仕方をかえたからなのか、それともたまたまマーケットのトレンドが変化したためなのか
などがあります。
これらはどのような方法で明らかにすることができるのでしょうか。
一つの方法としてランダム化比較試験があります。
ランダム化比較試験と交絡因子
「①治療薬Aは、疾患Bにどの程度有効か」の因果関係を明らかにするにはどのようにすればよいでしょうか?
病院にあるデータから疾患Bの患者データを抽出し、治療薬Aを投与した患者としなかった患者の予後を比較すれば明らかになるでしょうか?
結論をいうと上記のような形でデータからは治療薬Aと予後の因果関係を導くことはできません。
本書中でも何度も記載がありますが、そのデータがどのように作成されたかを考慮せずに、データから因果関係を明らかにすることはできません。
明らかになるのは相関関係のみです。
なぜならば、例えば治療薬Aは副作用が強く、健康状態が良い患者にしか投与できない薬であったとします。
その場合投与患者の予後が良かったのは治療薬Aの効果ではなく、健康状態が良かっただけとも考えられるからです。
この時”健康状態”は”治療薬A”と患者の”予後”の両方に影響しており、このような因子を交絡因子といいます。因果ダイアグラムを書くと下記(図1)のようになります。
ではどのようにすれば交絡因子の影響を考慮した形で、因果関係を明らかにすることができるのでしょうか?
代表的な解決策としてランダム化比較試験(RCT: Randomized Controlled Trial)があります。これは研究の対象者を2つ以上のグループにランダムに分け(ランダム化)、治療法などの効果を検証する方法です。
今回のケースでいうと患者Bの中から無作為、すなわちランダムに治療薬Aを投与する患者、投与しない患者に分けて予後を確認するといった方法になります。対象をランダムに選択することにより、投与群と非投与群における健康状態の偏りがなくなるため、健康状態(=交絡因子)の影響を無効化できます。
ランダム化比較試験は、統計を学んだ人にとっては当たり前の手法かもしれませんが、「ランダムに選択する」ということが中々受け入れられませんでした。
それではランダム化比較試験はどんなケースにも適用できる万能の手法なのでしょうか?
ランダム化比較試験の限界 – タバコの有害性
ランダム化比較試験は、どんなケースにも適用できる万能の手法なのか?
結論をいうとNoです。ランダム化比較試験は万能な方法ではありません。
本書ではその例としてタバコの有害性の検証について述べられています。
タバコの有害性をランダム化比較試験で評価する場合、ランダムに対象者を選択し、対象グループには何十年に渡り強制的にタバコを吸ってもらい、また非対象グループにはタバコの喫煙を禁じて試験をする必要があります。
これは人権問題になりますし、どう考えても実現不可能です。
そのためタバコの有害性を検証するためには、タバコの喫煙と健康状態について後ろ向きデータを用いて分析する方法を取られました。
しかしながらこの方法では、交絡因子の影響を完全には排除した説明ができないため、一大論争となりました。
特に統計学の大家であるフィッシャーが、タバコの有害性について最後まで認めなかったのは大変興味深いですね。
因果ダイアグラム
ランダム化比較試験以外でどのような方法があるでしょうか?
著者が提唱している因果ダイアグラムは、その方法のひとつです。
因果ダイアグラムも交絡因子となる可能性のある因子を研究者自身が定義しなければならず、単純に客観的な評価ができるわけではありませんが、因果関係を分析するのに有効な方法とされています。
因果ダイアグラムの詳細については、ここでは述べませんが詳細を知りたい方には、先にも述べました「入門 統計的因果推論」をおすすめします。
最後に
このブログでは、「因果推論の科学 「なぜ?」の問いにどう答えるか」の本を紹介させていただきました。少しでも参考になれば幸いです。