「n=1の科学」考

ツイッターで「研究者のくせにn=1で語りやがって」とよくお叱りを受ける。研究の世界では、実験サンプルの数(n数)が重要。今回うまくいっても次に同じ条件で試したら全然違う結果になるかもしれない。これでは「この条件がそろえば必ずこれが起きる」とは断言できない。

だから実験科学では、なるべくたくさんのサンプル数(n数)を増やし、同じ条件がそろえば同じ結果が生じる、という「再現性の高さ」を、理論の正しさの証拠として示そうとする。私も学術論文ではn数を重要視して書いている。でもここ、ツイッターやん。学術雑誌とちゃうで。

さて、それはそれとして、サンプル数が1つだけなら、経験数が1個だけなら、つまりn=1なら、科学的ではない、という意見には、私は素直に「うん」とは言えない。n=1でも科学的といえる条件があるのではないか、という気がしている。それが何なのか、少し言語化を試みたい。

たとえば教育の世界では、n数をそろえることがほぼ不可能、という場面が非常に多い。たとえば、「優しい先生に指導されたら子どもはどう反応するか」という実験をやってみようとした場合。そもそも、まったく同じ「優しい先生」の数をそろえるのが不可能。先生一人一人が個性的だから。

ある先生から優しい声をかけられたらうれしいかもしれない。でも別の先生だと、背筋が凍るような思いをするかもしれない。先生方に「同じようにふるまってくださいね」と言ったところで、先生の性格が違うから、言葉は同じでも印象が全然違う。このため、「同じ条件」をそろえることができない。

実験科学では、同じ条件をそろえることができたものだけを対象とする。たとえば、まったく同じ条件で製造した鉄の棒なら、品質もほぼ同じだから、サンプル数をいくつも増やすことが可能。同じ条件で実験したら、同じような曲がり具合とか熱の伝わり方をするだろう。でも人間の場合。

そもそも同じ人間がいない。双子(一卵性双生児)がいるじゃないか、と言うかもしれないけれど、一卵性双生児でも異なる経験をすると微妙に個性がずれてくる。仲の悪い双子なんかもいたりして、あえて相手と違いを出したいというケースもあって、気をつけないと必ずしも同じ条件にならない。

それに、人間が経験することも、ほとんどのことが1回こっきり。同じ体験をしても、こちらの気分が違えば全然違う印象になり、生まれる感情も異なったりする。たった一人の人間の中で同じ体験を複数しようとしても難しい。人間に関することは、n=1がほとんどと言えるかもしれない。

でも不思議なことに、n=1の体験談がすごく参考になるという体験を、誰しも持つと思う。あの人と私は明らかに違う人間で、その人が以前経験したことと、いま自分が経験していることもいろいろ違うはずなのに、なぜか共通点を見出すことができ、解決策のヒントをもらうことができる。これはなぜだろう?

息子の1歳半検診の時だったか、イラストを見せて「犬はどれ?」と訊かれたとき、息子は迷わず犬のイラストを指さしてビックリした。言葉もろくに話せないし、何より、そんなに犬に出会う機会もなかったし、絵本でも限られたイラストしか見ていないはず。なのに犬と猫を見分けた。ビックリ。

犬と猫の違いを言葉にして説明するのって、難しい。両方とも耳が上にあって、鼻が黒くて、ひげがあって…共通点があり過ぎて、違いを表現しづらい。特に犬なんか、巨大な犬と小さな犬を見たら、「ホンマに同じ生き物なんか?」と疑問に思うほど。

それだけ品種によって姿かたちが大きく違い、しかも一匹一匹模様も違うから、なぜ「犬」という共通した識別ができるのか、不思議で仕方ない。検診後、息子に様々な犬や猫の写真やイラストを見せて試してみたけど、犬と猫を間違えることはなかった。どれもこれもn=1の個性的なものばかりなのに。

どうも人間には、全く姿も形も違うものから、共通するものを見出すことができる能力があるらしい。毛の短いネコも長いネコもネコ、ってわかるし、毛の長い犬と毛の長いネコでも同じとはみなさず、犬、猫ときちんと見分けられる。幼い子でも。n=1ばかりの体験から、なぜ普遍的な学びができるのだろう?

深層学習という人工知能の学習法が開発される前、ロボットアームに荷物をつかませる、という作業は非常に苦手だったのだという。同じ形で同じ重さ、同じ材質の荷物を、同じ場所、同じ傾きに置いておかなければロボットアームはうまくつかめなかった。まったく同じ条件にそろえねばならなかった。

ところが深層学習は違っていた。まったく異なる形、重さ、材質、そして微妙にずれた場所に置かれた荷物でも、正確につかむことができるようになった。どの体験も異なっているために、どの体験サンプルもn=1でしかないのに、なぜ?同じ条件なんかまったく揃えていないのに、どうして?

深層学習では、膨大な失敗を経験させる。荷物をつかもうとしてもつかめない、という体験をたくさん。形や重さも材質も異なる荷物をつかもうとする体験を、とにかくやたら大量に学ばせる。すると、不思議なことに、どんな荷物がどんな風に置かれていても、「つかむ」という共通した体験を学んでしまう。

どれもこれもが個性的なn=1の体験なのに、その個性的な体験に通底する共通点を学び取る。同じ条件なんか全然そろえていない体験ばかりだけれど、ともかく大量の体験を学ばせる。つまり、まったく同じ条件をそろえたn数を確保するではなく、一つ一つ異なる体験(n=1)を大量に。

すると、どんな形でも重さでも材質でも、荷物がどんなに変な角度で置かれていても、正確にロボットアームがつかめるようになるのだという。大量のn=1の体験から、共通する何かを把握し、「つかむ」ことを可能にしてしまう。近年の人工知能の発展は、「n=1の科学」と言ってよいように思う。

私はツイッターであることをよいことに、学術雑誌ではない場であることをよいことに、n=1の体験をつぶやきまくっている。ただし、私はn=1から極力普遍性を引き出そうとしている。「いや、n=1から普遍を語ったらあかんやん!」というツッコミが聞こえてきそうだけれど、少し待ってほしい。

実は、n=1の科学が、古くから存在する。古生物学や地球科学などの分野。私は、科学の作法を三つ(実験科学、観察科学、理論科学)に分けて理解しているけれど、これらの学問は「観察科学」にあたる。では、観察科学はどのようにして学問を進めているのだろうか?

ある地層からサンゴの化石がとれたとする。すると、観察科学では、とりあえず大胆に「この辺は昔、温かい海だった!」と仮説を立ててしまう。非常に乱暴な行為のように思える。だって、たった石ころ一つから、古代の歴史を堂々と語るという大胆不敵なことをしているのだから。その代わり、条件がある。

別の石ころからも、大胆な仮説を紡ぐ権利を認めること。そして、仮説と仮説を戦わせ、生き残り競争をさせること。すると、仮説と仮説の戦いとなり、どちらの石ころも説明できる、新たな仮説を紡ぐことになる。もし矛盾した仮説が別の石ころから出てきたら、また仮説同士戦わせ、生き残り競争。

こうして、n=1から紡いだ仮説同士を戦わせ、それらすべてを矛盾なく説明できる新たな仮説を紡ぐ、という作業を延々と繰り返していく。すると、大概の石ころ(化石)を矛盾なくうまく説明できる、強力な仮説だけが生き残る。こうした仮説は、まあまあ、正しいとみなすことができる、と考える。

もちろん、別の石ころからとんでもない仮説が出て、それまで信じられてきた仮説がひっくり返ることがある。昔は恐竜はトカゲと同じは虫類の仲間で寒さに弱い、なんて言われていたけれど、今は鳥に近いと言われるようになっている。これも新証拠が出てきて、仮説を紡ぎ直すことになったから。

このように、「正しい」というよりは、難しい言葉で言うと蓋然性というか、ま、おおむね合ってるんじゃない?って仮説を紡ぐことができるだけ、と言える。新証拠が登場して覆されるまでは、暫定の正しさがある仮説、ということになるだろうか。観察科学は、すべてを仮説としてとらえる特徴がある。

私は、人間に関することを学ぶには、この「観察科学」のやり方が適しているように思う。そもそも、人間のことで同じ条件、同じ人間をそろえることが困難なら、そこは諦めて、すべてはn=1なんだと腹をくくる。そのかわり、n=1から、ともかく大胆に仮説を紡いでしまう。できるだけ普遍的な仮説を。

その代わり、あっちのn=1から紡いだ仮説と、こっちのn=1から紡いだ仮説を公平に扱う。えこひいきしない。そして仮説同士を戦わせ、両方のn=1を矛盾なく説明できる新たな仮説を紡ぐ。また別のn=1に出会ったら、そこからも仮説を紡いで、今までの仮説と戦わせ、生き残り競争をさせる。これを繰り返す。

すると、だんだんと強力な仮説が生き残るようになる。違うと言えば違うところがたくさんある新事態だけど、これまでに培った仮説で対応できるものだと分かるようになってくる。異なる荷物が異なる場所にあってもつかめる、人工知能のロボットアームのように。

そして人間は不思議なことに、自分の中にしか蓄積できていない体験を、他者に語ることで疑似体験させることができる。もちろん、相手は異なる体験をしてきているから、擬似体験しても、自分の手持ちの体験から再構成したものだから、誤解もしばしば起きる。でもそれを踏まえたうえで。

「あー、そういえば私にも覚えがあるから、この人の言うとおり、こういうときはこうした方がいいかも」と、参考にすることができる。まったく同じ条件ではないし、しかも他人の体験、見解なのだけれど、少なくとも参考にはなる、ということが可能。これ、非常に不思議な現象だけど、そう。

私は、n数を稼がねばならない実験科学の研究者なのだけれど、こと人間に関すること、人生に関わることって、実験科学の作法が本当に適さない。うまくいかない場面が多すぎる。でも、観察科学の方法とは相性がよい、と感じている。だから、同じ条件のそろったn数を増やそうとするより、

異なる条件のn=1で構わないから、それを沢山こなす。そして、共通する部分、異なる部分を見分け、言語化し、両方を説明できる仮説を大胆に立ててみる。新たな現象を目にしたら、またそれも参考にして仮説を紡ぎ直す。ひたすらこの作業を繰り返していくと、意外にうまくいく理論というのを構築できる。

n=1の科学、それは、試行錯誤し、たくさんの失敗を重ね、その一つ一つの経験から仮説を大胆に紡ぎ、「仮説の生き残り競争」を延々と続けて、生き残った仮説を「当面妥当と考えてよい理論」として採用する、という作法になるかと思う。

私がツイッターでつぶやくのは、こうした「仮説の生き残り競争」で生き残ってきた仮説だったりする。もちろん、それは仮説にすぎないから、新現象が見つかったら紡ぎ直さねばならないもの。でも、ある程度妥当なものとして扱ってよい、と思えるものをつぶやいている。

私は、こうした「n=1の科学」も、一定の妥当性、蓋然性があるものと考えている。これを否定する姿勢は、かえって科学的ではないと考えている。実験科学のようにn数をそろえたものではないから、いつ覆されるか分からない仮説にとどまるが、ある程度妥当な仮説なら紡ぐことは可能。

人間に関することは、実験科学ではなく観察科学で探究するしか事実上方法がないのだから、贅沢言わずに、n=1をともかくたくさん扱い、仮説を紡ぎまくり、仮説のブラッシュアップに努めた方がよいように思う。

いいなと思ったら応援しよう!