見出し画像

『因果推論の科学 「なぜ?」の問いにどう答えるか』 ジューディア・パール , ダナ・マッケンジー (著), 松尾 豊 (解説) を、内田樹『レヴィナスの時間論』と一緒にして感想文を書く。はい、これは私の感想です。エビデンスはありません。n=1です。

『因果推論の科学 「なぜ?」の問いにどう答えるか』

ジューディア・パール (著), ダナ・マッケンジー (著), 松尾 豊 (解説)

Amazon内容紹介から

・今までの統計学では答えられなかった「なぜ?の科学」とは?
・それは3段の「因果のはしご」を使って説明できる
・著者は人工知能界のノーベル賞にあたるチューリング賞受賞!
・現在のデータ主義には限界がある。それを乗り越える「因果推論」とは?
・その商品が売れた理由をどう分析し、新たな儲けにつなげるか?
・公衆衛生におけるベストな選択肢の考え方とは?
・人間のように考えられる人工知能=強いAIはつくれるか?
・そもそも私たち人間はどのように「因果関係」を考えているのか?
統計学とデータ分析を超えた新たな学問の誕生!
人工知能と人類の未来を知るために、なくてはならない一冊。
データ分析、マーケティング、意思決定に携わるビジネスパーソンも必読!

ここから僕の感想

 さて、先日予告した通り、『因果推論の科学』を読み終わったので、その前日に読み終わった『レヴィナスの時間論』と一緒に、感想文を書いていきます。

 この二冊、全然違う分野の、全然違うテーマの本なのに、なんで感想文をひとまとめで書こうと思ったかを、説明していこうと思います。

 『因果推論の科学』は人工知能の巨人、ジューディア・パール教授(UCLAのコンピュータサイエンス学科)が書いた本です。普段は科学者同士では数式で思考と会話をしているところを、一般人のために言葉、文章で書いてくれた本なのですね。前書きにも、そういうことをパール氏は書いています。ただし、この方、肩書に「哲学者」ともある。そう、人工知能の研究は数学やデータサイエンスとともに、哲学的に人間の思考プロセスを理解することも必要なのですね。

 一方、内田樹氏は、著書の執筆者紹介を、見ると哲学者、武道家とあります。リベラル寄りのメディアで、政治についての評論活動もする、その印象が強い方もいらっしゃるかと思いますが、本業は哲学の研究者、特にレヴィナスの研究者です。『レヴィナスの時間論』は、昨日、書いた通り、内田氏のレヴィナス三部作の三冊目で、レヴィナスのハイデガー批判を基調とした講演録「時間と他者」を読み解いていく内容です。古代ギリシャに始まる西欧哲学の総体、その最先端にいたハイデガーが、なぜナチスの擁護者となったのか。ハイデガー批判をすることは西欧哲学の歴史全体への批判にもなっている、そういう視点で、レヴィナスの難解極まりない文章を、一文ずつ逐語的に内田氏が読み解いていく本です。

 この、およそ異なる領域・テーマの二冊の本をなんで一緒に論じよう、感想文を書こうと思ったか。

 それは、この二冊が、同じ敵に対して、思いきり喧嘩を売っている本のようだなと思われてきたからなんですね。もちろん立ち位置は違います。攻撃の仕方も違います。しかしある共通の知のあり方に対する強烈な批判、攻撃の本だと感じたのです。

 もちろんそれは僕の感想です。個人的な感想です。

 そう、『感想』。そこが大事。

 僕は仕事をやめてから、感想文だけを書いて日々、暮らしています。読書感想文が多いけれど、音楽、スポーツ、政治、いろんなテーマについて感想文を書いています。どの分野についても僕は専門家ではない。専門知識なしに、感じた想いを書いている。論文とか評論とか批評とか、そんな立派なものではない。すべて「感想文」です。小学生の読書感想文と、基本的に変わらないものです。

「それはあなたの感想ですよね?」
「エビデンスは?データは?」
「N数はいくつですか?」
「有意水準は?検定はしたの?」

 いや、ひろゆき氏に限らず、今どきビジネスの現場でも国会でも小学生までもこうやって相手を問い詰め論破していい気になる人が、ほんとに増えましたよね。

 そう問い詰められても、私の場合、「はい、僕の感想です。エビデンスはありません。N=1です。」としか答えようがない。

 先程の「ひろゆき的問い詰めのパターン」。あなたの感想ですよねに続くのは、科学の、その中でも統計学の用語で問い詰めていますねよ。「N数は?」「有意水準は?検定はしたの?」

 そう。いまどきの知的暴力の暴走というのは、「統計学」が科学的であることを支える中心となって、起きているのではないか。

 ということ、いままでもうすうす気づいて、僕はときどき反発していたことに、『因果推定の科学』を読んでいて改めて思い起こされたわけです。

 たとえば新型コロナ発生直後、安倍さんが休校宣言を出した直後の国会。蓮舫が「エビデンスはあるんですか」と声高に質問したのを見て「バカか、今はまだ十分なエビデンスはあるわけないが、今分かっていることからの論理的推論で、必要だとなったからやってるにきまってるだろ」と思ったように。エビデンスエビデンスと叫べば正当な批判をしていると思うような知的退廃に対する違和感反発はずっと持ってきたわけですが。

「統計学は最強の科学である」みたいな本が幅を利かして、データのエビデンスがあるものだけが価値がある。そうでないものの価値を認めない。ビッグデータの時代、データサイエンスがもてはやされる時代、その流れに乗れないものは全て時代遅れ。

 文学思想哲学歴史学に代表される人文学は国家予算を使って保護する必要のない「感想の言い合い」のようなものだ。こういう認識は文科省による大学改革にも現れています。

それって、なんかおかしいよなあ。

 という違和感を抱えて隠居生活を送っているという、僕の状況からこの二冊を読むと、そういう「エビデンス・統計学暴走風潮」へのはっきりとしたアンチテーゼとして読めるのてすね。

 いやいや、内田氏の本がそうなのは、自明というか当たり前だけれど。『因果推論の科学』は、統計学データサイエンス側の本なんじゃないの?と思うでしょう。

 内田氏の本は、哲学というのは、科学ではない。エビデンスではなく、N数=1の、単独者の思考そのものに価値がある、という学問です。その単独者というのはどういうものか。それが他者とどのような関係を取りうるものか。その極限を思考する本です。

 これは学問だけど、科学でない。だから、内田樹氏の本は、「それはあなたの感想ですよね」に対して「はい、私の感想ですが。何か?」という本なのは、当然です。レヴィナスという人が、明らかに、内田樹氏に輪をかけて「はい、私の感想ですが。何か?」という人のように思われるので、内田氏がレヴィナスについて書いている本には、データもエビデンスもないし、Nは1で「私」でしかない。この本、学術論文的な文章ではありません。

 ちなみに、ときどきこんな文章が出てきます。「ラカンはどこかでこんなことを言っている」

 レヴィナスやハイデガーについてはさすがにきちんと原典から引用し、レヴィナスについては仏語から自分の翻訳しながらその意味を考えていくのですが、それを説明している文章の中では、出典も明らかでない内田氏の記憶の中で「この人はたしかこんなことを言っている」というような記述で論は進んでいく。そして、分かっていることを説明するのではなく、分からないことをそのままに、どんどん話は進んでいく。

 内田氏とか柄谷行人氏のことを考えると、どうしても僕は「思想家」という呼び方をしたくなる。「思う」「想う」の人なのです。内田氏が、柄谷氏が、きわめて特異な単独者が、「この人はこういうことを言っていたなあ」という記憶の中の先哲たちの言葉を手掛かりに、どんどんと独自の解釈で、考えたことが語られていく。それが思想家の本の本質です。それに「エビデンスは?」「N数はいくつ?」と問うことのバカバカしさ。これはどんなバカでもわかると思います。

 人文学は、一部「科学」ではあるが、その大半は「科学」ではない。「人文科学」ではなく、「人文学」です。科学ではない学問というのがあるのです。

 歴史学は、文献や史料を新たに見つけたりして事実を明らかにするというのは「科学」の部分もあるが、その意味を考察するのも「歴史学」であって、それは科学をはみだした「人文学」です。文学は科学ではありません。文学です。「それはあなたの感想ですよ」に対して、堂々と、自信をもって「はい、私の感想です。感想も含む思想です。」というのが人文学の基本的ありようです。

 というわけで、内田氏の本が、「統計学的に有意なエビデンスを錦の御旗に専横的態度をとるエビデンスバカ」に喧嘩をうっているのは、ある種当然のこととして了解してもらえると思います。

 そしてここからが本題ですが、意外なことに、コンピュータサイエンスの、人工知能の巨人、パール氏の『因果推論の科学』という本、これ、統計学に対して全面的に思いきり喧嘩を売っている、そのことが中心テーマの本だったのです。

 どういう喧嘩の売り方かというと、統計学が「相関関係」は扱うが、「因果関係」に対してきわめて及び腰である、というのを批判し、どうやったら因果関係を科学として扱えるか、数式化して扱えるようにするか。これがこの本の扱う基本の問いです。

著者パール氏は、「因果ダイアグラム」として因果関係を構造として整理するというアイデアを核に、それを「因果関係の形式化」としてまず作った上で、その関係を数式化し、そこにデータを入れていく。という方法で「因果関係」を数式、データで扱えるようにしていく様々な手法を考案していくのですね。

その視点と手法を発展の歴史に沿って順を追って解説する形でこの本は進んでいくのです。

 どれだけビッグデータの自体になって、そこからさまざまな相関関係を観察し抽出することができても、それはそのままでは「因果関係」にはならない、とパール氏は言うのです。回帰分析なんかしたって、相関関係を細かに見ることが出来るようになるだけで、因果関係を扱っているわけではない、というわけです。

 データ観察というのは因果関係を考えるための「一段目」の梯子でしかなくて、その上の「介入」の梯子、その上の「反事実」の梯子、この二段の梯子を上らないと、因果関係を数学的に扱うことはできない、ということを、一冊かけて解説していく本なのですね。

 で、どうやって数学的に扱うかの数学的説明の部分は、実は数学苦手の僕には、その意図と意義は理解できたけれど、具体的操作中身や数式として理解できたかというと、正直半分くらいしか分からなかった。「こういう操作をすると矢印が消える」とか「この場合は調整したらダメ」で「この場合は調整してよし」みたいなことを数学的に説明してく因果ダイアグラムを数式に置き換えていくのだが、何か所か「まったくわからん」ところが出て来て、読むのを挫けそうになってしまったのでありました。

 しかし、この本、その間を、具体的な事例、様々な面白いエピソードでつないでくれていて、それはすごくよく分かる。「タバコはガンの原因なのか」「壊血病とオレンジとビタミンC、南極探検隊スコットの悲劇」とか「温暖化と人間の二酸化炭素排出の関係」とか。

 そう、いちばん最後の章では「広告効果」の話題もちょっとだけ出てきます。

 さて、ここでちょっと横道に入ります。

 数学的思考に僕は全然向いていないのに、なぜ僕がこの本にすごく惹かれたのか。というか「分からないけれど、とにかく読むぞ」と思ったかというのを、ここから自己分析してみます。

 まず第一に、現役時代の広告マーケティングの仕事で、ここで扱われている課題にひどく苦しめられた経験がたくさんあるからです。

 まさに「介入」の効果について、常に予測と検証を求め続けられた。

 この広告を打った場合と打たなかったとき、あっちの表現にした場合とこっちの表現にした場合で、売り上げがどう変化するか、というのを、事前に予測したり、結果として検証したりするということが、すごくたくさんありました。そして、どれだけやっても「なんだかはっきりしない」ということが実務上はすごく多かった。売れないと広告のせいにされて、売れた時は商品がよかったり営業部隊が頑張ったり、予想外にPR的な部分が話題になつたから、みたいなことで「広告のおかげで売れた」という結論になったことは、ほとんどなかったなあ。と恨み節。

というのが、まず一つの理由だろうな。「電通さんの案を採用すると、この車は年間何台売れるのかシミュレーションせよ」、というお題を競合プレゼンのたびに頂戴し、どういうアルゴリズムにして台数を出すのか、どうやったって未確定だったり測定不能な要素が台数算定の途中には入ってきて、こんなもの出してどうするのか、と思いながら、プレゼン準備を毎回していたのだよな。そういうことと、この本の内容は、すごく深く関係しているのである。

 二つ目は、「御用学者」について、長いこと、特に原発事以降、考えてきたことと深い関係があるな。

 この本で言えば、タバコと肺がんの因果関係を認めるまでに、すごく長い時間がかかり、多くの医学者科学者が、むしろタバコ会社側の「因果関係はない」という方を支援するような役割物言いをしてきたこと。「統計学は相関の強弱しか語らない」というのが誠実だ、という学問の正確ゆえに、「因果関係があるとは言えない」という立場をとってしまう。

 これと同様のことが、公害、例えば水俣病についても、薬害血液製剤の事件でも、原発事故でも、諫早湾や長良川の河口堰と漁業被害など、多くの社会問題で繰り返されたこと。

 統計学者の「因果関係を語る言葉や論理や手法を持たない」ということゆえの学者としての誠実さを守る態度が、被害を大きくし解決までの時間を限りなく伸ばし、「統計的に優位なエビデンスが揃う」というのはつまり被害者が十分にたくさん出るまで待つということになるというバカバカしさ。水俣病でも、どれだけの学者が「因果関係は不明」と言い続け、被害を長引かせ、加害企業の責任を放置する根拠となり続けたか。こういう問題における科学者というのが、「企業から金をもらった御用学者」というふうに僕は思っていたわけだけれど、「相関関係までは慎重に認めても、因果関係を語ることを避ける事こそ科学的だ」という統計学の悪癖欠点ゆえに、学問的に誠実であろうとすると「因果関係は認められない」と言ってしまう学者が多かったんだろうな、という事情はなんとなく腑に落ちるのだ、この本を読むと。

 で、このパールさんは、そういう統計学的立場から及び腰になる科学者というのを、いろいろな事例の中で鋭く批判しているのだよな。人の命や健康にかかわる問題というのは、ランダム化比較試験を行えない場合が多いので、因果関係を明らかにすることが難しい。そのために、及び腰な「相関関係への言及」しかできない、という事情なんだな。これを打破するには、パール氏が開発した因果推論の手法を使うしかない、というのがこの本の主張なのだな。そうすればランダム化比較試験が行えない場合でも、単なる相関関係の強弱ではなく「因果関係」について、科学は語る言葉を持てる、とパール氏は主張しているのである。

 温暖化についての章で、実際の気候学者はアレンとスレッドが統計学的厳密さを配慮して「ヨーロッパの夏の気温が通常より1.6度上という閾値を超える異常な状態になった要因の半分以上は、人間の影響にあるとみなせる可能性が非常に高い」と書いた。パール氏は、この文章が統計学的にどのような厳密さを意識して言葉が選ばれているかを解説した後で、因果ダイアグラムを用いてそれを整理し直し、相関関係の言葉ではなく、因果関係の言葉で自分が言うとするならば「二酸化炭素の排出は2003年の熱波の必要原因であった可能性が非常に高い」と言う、と書いている。

「必要原因」という耳慣れない言葉が出てくるけれど、この方が原因と結果の関係をストレートに伝割るでしょう、とパール氏は書いている。

 三つめは、僕の地震予知に関する長期的関心の中での「相関関係と因果関係」への興味があったということ。地震学と地震予知の間の不健全な権力関係が、地震予知の研究を著しく阻害しているなあ、というのが僕の立場意見なので、そのことを考える時に、「相関関係と因果関係」「どこまで言い切るか」についての著者の問いというのは、この問題についての混乱を収めるのに絶対有効だよなあ、という興味があったから。

 というわけで、この本の、おそらく著者がいちばん伝えたかった「因果推論を因果ダイアグラムを作った上で数式化する」という基本アイデアと、それがいろいろなことに役に立つというか革命的な変化をもたらす、ということは僕にも伝わったのだけれど、肝腎の「数式化できるんですよ、こうすると、ほら簡単で凄いでしょう!」というパール氏の伝えたい具体的な中身は、残念ながら僕には理解できなかったのでありました。

 さて、というここまで書いた僕の「感想」が、かなり僕の独自のバイアスによる変わった読解であるのではないか、とここまで読んでくださった方の中には疑う気持ちも起きてくるのではないか。と思います。

 ですので、松尾豊東大教授(人工知能学者)が、解説でそのあたりのことをとても上手にまとめてくださっているので、引用しておしまいにしようかな。ちょっと長く引用しますが、僕がここまで書いたことと比較しながら読んでみてください。

「私自身は不確実性と因果推論を多少進めたくらいの内容ではないかとタカをくくっていた。本書の解説を引き受け、まともに読んで、非常に驚いた。このような極めて独創的な、極めて意義の大きな分野を作り上げていたとは知らなかった。勉強不足であった。」
「本書の中でパール氏は『AIコミュニティは比較的、穏やかな海のような場所だったが、私はそこを離れて、風の吹き荒れる統計学の海へ向かわなくてはならなかった』と記述している。」
「まず『因果』というものが、科学の世界で歴史的に異端だと見なされていたことは本書の冒頭に詳しく書かれている通りである。研究の現場でもデータ分析の結果について「相関がみられたが、因果については何も言えない」と枕詞をつけることはごく常識的である。若い研究者、学生は、むしろそうした「お作法」を身に着けるように訓練されている。そしてその原因が「因果について表現できる言語がなかった」というのはまさに著者の慧眼である。」
「本書の第一章では、早速『因果ダイアグラム』という主役が紹介される。しかし、この時点では、なんとも心もとない。著者自身が書いているように、いかにも「子供だまし」と思えるほどにシンプルである。個人的な理解に基づく主観的なものであるというのは、従来の科学的な考え方からすると居心地が悪い」
「ところがその疑念が、本書を読み進めるうちに氷解する。特に第三章が珠玉である。」
「第七章のdo計算法は、はしごの二段目「介入」の暖を上るためのものである。介入することが重要であるということと同時に、現実世界では介入せずに同じ計算をする必要がある場合が多い。そこでこのdo計算法の登場である。」「つまり、介入を観察に置き換えられるということである。このことの現実的意義は大きい。」
「さて、本書は極めて深い洞察に満ちていると述べた。その理由を、私自身の個人的な意見として少し述べてみたいと思う。」
「本書で扱った因果ダイアグラムは、主観的である。」
「そもそも現象の捉え方は主観的である。例えば、ある物体が存在するということ、物体間に関係性があると認識すること、現象をある評価軸で捉える事、こういったことのいずれにも、本来無限の可能性があるのだが、それを我々の認知の仕組みが個々人で比較的似ているがゆえに、結果として同じような捉え方をする場合が多い。それを客観性と読んでいるわけである。科学の客観性にはそうした欺瞞の一面がある。」
「実は、こうした問題に対しての最近のブレークスルーのひとつが深層学習であって、従来カテゴリーとして計算機に認識させることができなかった「犬」とか「猫」などを正確に認識させることができる。人間が客観だと思ってきたものが、何らかの事前知識ののったアルゴリズムによってたまたま得られるものであるとわかってきたということである。」
「本書で議論されている「因果関係」は、まさに絶妙な中間にあるものなのだろう。「カテゴリ」ほど個体差の少ない確固たるものでないとしても、日常的な生活に関する因果関係は、個人間、コミュニティ内でほぼ共有されている。」
「したがって人間はごく自然に、因果の構造を、世界モデルの一部として理解している。」
「ところが人間の身体が及ばない領域、例えば社会に関しての議論とか、経済に関しての議論とか、薬の効用についての議論になると、身体による介入ができないために、直観的な因果関係を用いることができない。そこではじめて「因果関係とは何か」とハタと考え始めざるを得ないのである。」「特にビッグデータが存在する時代になると、データの分析と言う手段が多く使われるようになる。その際、日常的な現象に関しては、人間には、介入の経験があり因果関係は分かる。また、社会的な現象に関しても、介入の経験と、見分で得た知識を組み合わせて、データの背後にある因果関係の構造らしきものを作ることができる。このことが「因果ダイアグラム」として描くということなのだろう。そして、この因果ダイアグラムをもとにしてデータ分析すれば、因果関係のない相関なのか、因果関係があるのかを、科学的な手続きとして認識することができるというのが本書の主張である。」「私が思うに、本書で語られている因果関係の難しさは、大きく二種類に分解できる。ひとつは「なぜ人間が因果関係を認識できるか」である。」「もうひとつは「なぜ人間でも因果関係が分からないことがあるのか」である。」
「そして、本書で書かれている通り、このことは人間の思考プロセスと密接に関係する。それでいて、「データを分析する場面」という現代的な前提条件に対しての、工学的な手法の提案でもある。そのバランスが、本書の構造を非常に難解にしている。また、独創的なものにしているのだろう。」

松尾豊 東大教授
 解説p569~576

 引用おしまい。どうですが、読んでみたくなりましたか。

 


いいなと思ったら応援しよう!

この記事が参加している募集