ジューディア・パール『因果推論の科学』を読む:統計を、AIを、そして科学について考える人は、ぜひ一読を!
英語圏ではすでにして評価の高い、ジューディア・パールの大著『因果推論の科学--「なぜ?」の問いにどう答えるか』(原題はThe Book of Why)が、ついに翻訳刊行された。実は私は原書を読みかけて挫折していたのだが、このたび邦訳が出たのを機に、ついに読み通すことができた。そして、本書を読み通したことで得たものは大きい。
ジューディア・パールは、人工知能への確率論的アプローチの導入と、ベイジアンネットワークの開発により世界的名声を確立し、「人工知能分野の巨人」とも呼ばれる人物である。ベイジアンネットワークなんて初めて聞くという人もいるかもしれない。人口知能研究の歴史という観点からざっくりその位置づけを説明すると、かつてAI研究は、「エキスパートシステム」と呼ばれるアプローチを採っていた。エキスパートシステムという言葉なら、たいていの人は聞いたことがあるだろう。専門家(エキスパート)の知識と推論能力をAIに与えて、エキスパートのような意思決定をさせようという考え方だ。しかしこのアプローチは、不確実性に対処できなかったせいで、袋小路に入り込んでしまった。そこにパールが登場し、ベイズ統計にもとづくベイジアンネットワークを提唱して、突破口を切り開いた。ベイジアンネットワークは、現代のテクノロジーを支える技術に成長し、DNA鑑定が効率的にできるのも、スマートフォンの充電時間が短くてすむのも、このシステムのおかげなのだそうだ(私も本書を読むまでそのことを知らなかった)。本書の第三章では、そのベイジアンネットワークについて、パールその人による、数式をほとんど使わないコンパクトな解説を読むことができる。
パールは、ベイジアンネットワークの可能性と威力に夢中だったが、やがてこのアプローチの限界に気づいてしまう。そして、「あとは任せた」とばかり、自分が生み育てた分野を去り、因果推論という、スキャンダラスな分野の開拓に踏み出したというのだ。
ところでみなさんは、「科学は How? に答えようとするものであって、why? に答えようとするのは、科学者のやるべきことではない」といった話を見聞きしたことはないだろうか? 私がはじめてその手の話を聞いたのは、今から40年以上前、20歳前後の頃だったと思う。当時の私は、「まあ、言わんとすることはわかるけど、言葉尻を捉えても仕方ないよね。なんで?と不思議に思ったときに、どう表現するかに目くじら立ててもね...」ぐらいに思っていた。しかし本書を読むうちに、「科学はwhy?を扱わない」という思想は、私が思う以上に根深いらしいことがわかってきた。
ことの発端を、パールは次のように説明する。少し長くなるが、二つのパラグラフを引用しよう。
近代統計学のこの性格については、本書を読んで初めて思い当たったことがいくつもあった。たとえば、「相関関係は因果関係ではない」という警句の、裏のニュアンスもそのひとつだ。この決まりきったフレーズは(もちろん、基本的で重要な教訓ではあるのだが)、よくよく考えてみると、因果関係とは何かについてはまったく説明することなく、「因果関係のことなんて考えるなよ。道を誤るぞ」と言っているようにも読める。そして統計学者の大部分は、分野の創設者たちの教えに従い、因果関係について考えることを拒否し、科学的な問いの答えはすべてデータの中にあるはずだという、誤った信念を持ち続けることになった、とパールは言うのである。
ここで少しばかり視野を広げて、「科学はwhy?を扱わない」という思想の歴史をさかのぼってみれば、アリストテレスの四原因説に発する区分がありそうだ。アリストテレスは、原因には次の四つがあると考えた。質料因(何でできているの?:木でできている)、形相因(何なの?:椅子だ)、作用因(動いているのはなぜ?:何者かが動かしたから)、目的因(なぜそんなものがあるの?:腰掛けるため)である。はじめのふたつ(質料因と形相因)に関する疑問は、what?と how? で問うことができる。しかし、三つ目と四つ目(作用因と目的因)は、why? で問われる疑問だ。そして why?型の問いは、突き詰めれば、何者か(神?)の意図と行為に帰着するような問題設定なのだから、科学者はそういうことは問うべきではない、ということになったらしい。
アリストテレスについて、ジューディア・パールはこう書いている。
ここでパールは、アリストテレスは「反事実的推論」をいっさいしていないと述べているが、反事実を考慮する推論こそは、彼が提唱する「因果推論の科学」の重要な柱のひとつなのである。反事実的推論とは、実現しなかった事柄について、「もしも○○だったらどうなっていただろう?」と考えてみることだ。パールはそれを、「人間を人間にしているもの」だとまで言う。実際、人間は何の苦労もなくそうした反事実的推論を日常的にやっているのに、AIにはそれが非常に難しい。AIが、人間の言うことに対して適切に応答できるためには(たとえばチューリングテストに合格するためには)、反事実的推論のようなことができるようにならなければならない。
反事実的推論は、パールが唱導する「因果推論の科学」の重要な柱だが、実践面で、この新しい科学の柱のひとつになっているのが、因果ダイアグラムである。本書には簡単な因果ダイアグラムがたくさん出てくるので、それがどういうものかはすぐにわかるだろう。因果ダイアグラムには、素粒子物理学者が使うファインマン・ダイアグラムと同じぐらい、圧倒的な威力がある。本書を読むうちに、もはや因果ダイアグラムなしに考えるなんてムリだろう、という気がしてくる。だが、ダイヤグラムを使うことに対する抵抗勢力は、今もいるらしい。
ダイアグラムの重要性は本書を読めば実感できるはずだが、残念ながら、本を読んだぐらいでは、因果ダイアグラムをすいすい描き、確率をサクサク計算できるようにはならない(できるようになる人もいるかもしれないが....)。因果ダイアグラムを描くためには、状況に応じた慎重な考察ができなければならないし、そもそもダイアグラムを描くということは、モデルを作ることに相当する重要な仕事だ。さらに、ダイアグラムに現れる矢印付きの線分の背景には、込み入った関数や大量の計算がある場合もある(現実的な問題なら、たいていそうなりそうだ)。本書を一冊読んだぐらいでそれが楽々できるようになるなら、苦労はないだろう。
だが、本書を読めば、少なくとも因果ダイヤグラムのありがたみはわかるようになる。なんといっても、ダイアグラムを見ただけで、状況の全体像が把握できるのだ。全体像を把握することの重要性は、いくら強調してもしすぎることはない。あとは計算するだけなのだ。たとえ込み入った計算をすることになったとしても、そして計算をするために高度な工夫が必要になったとしても、問題解決という観点からは、それは簡単な部分なのである。
反事実的推論と因果ダイアグラム以外にも、パールが先頭に立って推し進める「因果革命」にはいくつか重要な柱があるのだが、辣腕ライターであるダナ・マッケンジーの協力もあってか、いずれの柱も、その内容と意義はしっかり伝わってくる。(ちなみに、Judea もDana も、ヘブライ語系の男性名である。最後がaで終わっているが、ふたりとも男性だ。また、本書には、旧約聖書から引いた素材をもとに議論を展開しているところが何箇所もあり、私にはそのあたりも興味深く読むことができた。)
これは間違いなく、重要な革命だろう。われわれは、現在進行中の科学革命の場に居合わせている。もしもみなさんが、「相関関係は因果関係を含意しない」とか「観察研究は所詮は観察研究でしかない」といった決まり文句を、20世紀の頭のまま一度でも口走ったことがあるなら(わたしもそのひとりだ)、本書を手に取り、21世紀の因果革命が見せてくれる光景を垣間見ておくぐらいのことはしたほうがいい。本書を読んで、損をしたと思う人はいないはずだ。