見出し画像

科学の文脈で縮約モデルと減算モデルを考える (ALife Book Club 3-3)

こんにちは。Alternative Machine Inc.の小島です。
メイヤスー『減算と縮約』の第三回をお届けします。今回はちょっと一呼吸おいて、科学の文脈から縮約モデルについて考えていきます。
前回までのものはこちら(#1, #2)からご覧ください。

前回は、ベルクソンの二つの知覚モデルをもとに「減算」と「縮約」という考えを紹介しました。
そして本論の流れとしてはこの「縮約モデル」を「減算モデル」へと復活させるためにどうするかということになっていきますが、今回は一呼吸おいて、科学の文脈での話をしてみようと思います。

科学での知覚モデルは縮約的か?

初回に科学的視点からみると言ってしまったのでこの話をしていきますが、哲学の議論を科学に落とし込むと大体つまらないんですよね、、そうならないように頑張りますので、どうかお付き合いください。

減算モデルと縮約モデルの大きな違いは、知覚が物質の性質に直に触れているかどうか、というところにありました。減算の場合は減らしているだけで、もとの性質を捉えているのに対して、縮約の場合はつぶす過程で質的に変わるため(例えば、元はただの波だったのに、つぶすことで「色」というものがでてくる)、もはやもともとの物質の性質ではないというわけです。

じゃあこれをもとに科学の文脈での知覚を考えよう、とすると、この辺から面倒になってきます。例えば色の議論での「もともとはどれも同質の波だけれど、縮約によっていろんな色になる」もまともに考えると厄介で、そもそも波が波である所以は時間での振動があるからであって、ある時刻でのスナップショットだけでは波はないはずです。つまり波はある時間幅があって生じるものなので、縮約がなければ波すらない、といえます。ただし量子力学の描像だと、光を粒子(光子)と見ることができて、その場合はいろんなエネルギーの光子が飛んでいると言い換えられるので、この場合は色は縮約的ではない(むしろ認識できる光子を選別するのだから減算的)といえるかもしれません。(でも、この場合も短い時間幅での観測を考えると、時間についての不確定性原理が生じて、、などとさらにめんどくさいことをいえたりします、、)

こんな感じで、厳密に考えようとするとなかなか大変になってしまうし、そもそもの目的を見失っている感があります。(こういう議論好きな人もいるとは思いますが、、)
そこで、科学の文脈で減算と縮約を考えるときにはこの辺をごちゃごちゃ考えるのはやめて、そもそもの区別である「知覚が物質の性質に直に触れているかどうか」にフォーカスすることにします。
これが科学にとってなにか意味のある視点になるかどうか、具体例を見ながら検討していきます。

知覚はかなり閉じている

知覚モデルについては『身体化する心』解説でも触れていて、特に#2ではエキスパートシステムというものと、簡単なニューラルネットワークモデルについてお話しました。こちらもぜひご覧ください。

これらは、視覚入力に対して出力を出すというシステムゆえ記憶がない(つまり減算的)ように思えますが、そもそも事前にいろいろと学習させる必要があり、それがシステムに埋め込まれているので、やはり縮約的というべきものかなと思います。

ここではもう少し最近のものとして"World model"を取り上げます。

この背景として、実際の視覚系においては外界からの入力よりも、内部からの入力のほうが多いということがあります。そこから、視覚は特徴検出器ではなく生成系なのだという見方がメインになりつつあります。(そして、この考えの大本はヘルムホルツとされています。)

このような考え方を背景として、生成系人工知能(入力を識別するのではなくて、画像や音声などを生成できるもの)を知覚モデルとして使おうという流れが出てきました。僕らもその線で論文出してますし、ここで紹介する"World model"もその一つです。

World modelにおける縮約

World modelはDavid Haらによって提案されたモデルで、学習させることでゲームをうまくこなすことができるようになります。
(実際の挙動はぜひこちらのページをご覧ください。)

このモデルの中核にあるのは変分オートエンコーダ(VAE)というものです。

World modelでの「縮約」。視覚入力はエンコーダーによって低次元のベクトルzに変換される。そして、このzをもとにdecoderが視覚イメージを内部的に再構成する。

上の図がその概要です。これはオートエンコーダ(自己符号化)というシステムの一種で、視覚入力を一旦低次元のベクトル(z)に変換するもの(エンコーダー)と、このベクトルから視覚入力を生成するシステム(デコーダー)の二つで構成されます。学習としては、画像をエンコーダーで変換したベクトルを、今度はデコーダーに入力して画像に変換したときに、もともとの画像が復元できるように訓練されます。

ちょっと複雑ですが、とにかく視覚入力が低次元のベクトルに圧縮されている、ということだけわかってもらえれば大丈夫です。

このWorld modelでは、まずはこのシステムを学習させ、その後のゲームの学習(どうやって行動したらよいか)では、もうもともとの視覚入力は扱わずに、圧縮されたzベクトルだけを考えます

よってこのモデルにとっては、どんな視覚入力が入ってきても、自分の中のzベクトルが変化するだけです。だから自分で完結しているし、部屋にこもってzベクトルをいじるだけでこの人の知覚しうる全てに到達できます。

よってWorld modelは、常にzベクトル空間に閉じ込められていて、どんな視覚入力があってもそこから逃れられません。これは「知覚が物質の性質に直に触れているかどうか」とはいえなさそうで、縮約的です。

知覚の減算モデルは考えられるか?

というわけで、基本的に知覚モデルは縮約モデルに分類されそうです。

では、そこから逃れた知覚モデルを考えられるでしょうか?

そもそも縮約モデルではない知覚を考える必要はあるでしょうか?

まず二つ目についてですが、ひとはなぜか色んなところに行きたがるし、「本物」を見ることでしか得られないことがある(ように思える)ということが念頭にあります。縮約の描像であれば、頭の中の「海」のイメージと、実際に海を見ることの差はないはずですが、でもやっぱりその差は大きいように感じます。それを考えたいということです。(これについては、弊社の最高科学責任者の文章をぜひご覧ください。)

そして、一つ目の問い「減算モデルとしての知覚」が考えられるのかということはまさにこの本を読んでいる目的です。
次回は、メイヤスーがどうやって縮約モデルを減算モデルに戻したのかを見ながらその可能性を考えていきたいと思います。

今回もお読みいただきありがとうございました!来週またお会いしましょう。

この記事が気に入ったらサポートをしてみませんか?