意識を持つAIの秘密 | MITメディアラボのヨシャ・バッハ博士

2024年11月9日 10:34

17,074 文字

みなさん、ありがとうございます。意識について語るとき、まず最初にそれが何を指しているのかについて合意を得る必要があります。私たちが意識について語るとき、まず第一に意味するのは二次的な知覚です。単にコンテンツが利用可能なだけでなく、そのコンテンツが利用可能であることに気づくということです。基本的に、そのコンテンツの中で何かが知覚されたときのような状態をモデル化するのです。
また、意識が起こるときは常に「今」起こっています。これが「今起こっている」という感覚、つまり現在性、現在という感覚です。私に何かが起こっているという感覚です。
三つ目の側面は、ある意味で任意のものです。それは、何かであるという感覚と、その視点から世界を見ているという感覚です。基本的に自己という球の表面に住んでいるようなものです。でも、意識を持つためにそうする必要はありません。例えば夜の夢の中でも意識することができ、時にはそこで起こっていることを目撃する誰かがいないこともあります。
つまり、単にイベントの認識だけを持つこともあるわけです。これは本当の定義というわけではなく、むしろ意識の現象学と呼ばれる特定の現象を指し示すものです。これを説明しようとするとき、この現象学を捉える必要があります。もう一方の側面は意識の機能性で、基本的にはそれを実現させる異なるメカニズムの背後にある配線と方針です。
私は、意識は心の中に一貫性を生み出すメカニズムだと考えています。基本的には、私たちのシステムのための機械学習アルゴリズムなのです。人間において観察されるのは、みんなが意識を持っているということです。これは本当に興味深いことです。これは博士課程の終わりに得られるような、極めて複雑な精神発達の頂点ではありません。指一本動かせるようになる前に到達するのです。
また、幼児期に意識を持てるようにならず、目覚められない人間は、永続的に植物状態のままで、どこにも進めないということも示唆しています。したがって、意識は最後ではなく最初に来るように見えます。極めて複雑な精神組織の結果ではなく、それと同時に現れるのです。
生物学で観察されるのは、基本的に私たちが理解できる複雑な動物はすべて意識を持っているということです。より単純なものはありません。代替案もありません。もし何か単純な代替案があれば、進化は多くの場合にその単純な解決策に収束し、意識を持たずに私たちと同じことができる人々が観察されるはずです。
したがって、私は実際にはそれが人間の脳を訓練する最も単純な方法だと考えています。別の機能的な観点から見ると、それは後でいわゆる意識の流れとして呼び出すことができるプロトコルとして使用できる何かに、任意の時点での作業記憶状態を投影することです。
これはバースのグローバルワークスペース理論における焦点の当て方にも非常によく反映されていると思います。統合された作業記憶の内容の上を何らかの形で移動するスポットライトというアイデアがあります。
私はAIを哲学的なプロジェクトとして考えています。AIの99%は単にデータ処理をより効率的にすることですが、1%がこの哲学的なプロジェクトです。人々がそれを同じものと考えたり、あるいは別のものと考えたりすることで多くの混乱が生じています。しかし、これは分野の少し異なる側面なのです。
現在、この心とは何か、そしてそれが自然の中でどのように実現されているのかという問いについて進展を遂げる最良の方法だと思います。AIは視点と制御理論を表現の理論と共に結び付けているのです。
これはAIが構築している思考の伝統であり、この伝統は多くの点でアリストテレスから始まり、そして近代ではライプニッツやフレーゲに続きます。彼らは言語の本質について考え、心理学の物理学について考えました。チョムスキーは、フレーゲの思考言語についてのアイデアをより体系的に形式化する方法について考えました。
アインシュタインは英語をある種のプログラミング言語に変換して、その中で真実を見ることができるようにするというアイデアを持っていました。そして基本的にミンスキーのプロジェクトを30年ほど先取りし、ミンスキーの30年前に、おそらく他の理由で失敗しました。
そして基本的に、この流れは現在まで続いています。アリストテレスを見ると、彼は非常に現代的な思想家です。キリスト教徒は彼をある種の教条的な人物に仕立て上げましたが、彼の著作を読むと、彼は非常に親しみやすい人物であることがわかります。彼は本当に歩き回って思考を巡らせ、アイデアを集めている人のようです。彼は現代の若い探検家のようです。
彼は喜んであなたと議論し、一歩下がって考え直すことができ、あなたが彼に反論を提示すれば反論を返すことができます。彼の著作を読むのは非常に新鮮です。また、彼は非常に成功しました。おそらく皆さんご存知かもしれませんが、彼はアレキサンダー大王の教師で、アレキサンダーは後に極めて成功した文明の建設者、征服者、政治家となりました。
彼は非常に博識でした。自然界の物事を説明するとき、彼は魂が極めて重要だと言います。それは基本的に自然界の活性化する原理です。彼はそれを物理的宇宙に刻印された基本的な動的形態と呼び、それが粗い形で物理的宇宙を形作ると言います。
魂は自然界のあらゆる場所に見出されるものです。生態系や植物など、自然界に複雑な構造が見られる場所では、魂を持つ何かがあります。しかし、理性は人間だけが持つ何かです。なぜなら、それには象徴的な反省や文法的な言語などが必要だからです。
彼の文章を見ると、本当に多くのカテゴリーを考え出しています。知覚、感覚イメージ、センサーデータ、画像認識プロセス、幾何学的形状、グラフ、ある意味で生成AI、感覚の再現、マルチシーンの解釈など、これらすべてのものに対する用語を持っています。それは非常に現代的です。
これを読む多くの哲学者は、自分たちのはるかに技術的でない物の見方にこれを当てはめようとし、しばしば用語を誤訳したり、アリストテレスが意図した働きをしない方法で用語を統合したりします。しかし、現代の認知科学者やAI研究者としてこれを読むと、彼は私たちの一人なのです。この男はコンピュータを持っていたら最高だったでしょう。
非常に興味深いのは、彼にとって意識は神秘的なものではないということです。彼はそれを通常「現実性」と呼びます。彼は難しい問題を持っていないように見えます。私は、デイビッド・チャルマーズが有名にブランド化したこの意識の難しい問題は、啓蒙時代以降に起こったものだと考えています。サンスクリット語の外では、この文化の外では、それは大きな問題であるようには見えません。
西洋の哲学者たちは意識について絶望し、いくつかの異なる立場に至りました。まあ、心と物質は完全に別個のものであり、その相互作用は非常に奇妙です。なぜなら、定義は完全に閉じているからです。観念論は、すべては心であるとします。汎心論は、心は物質がある場所にはどこにでも分布している物質の側面であるとします。
物質主義は、すべては単なる物質とメカニズムだとします。同一性理論は、精神過程は脳過程とまったく同じものだとします。それから統合情報理論があります。これはある意味で管理されています。誰かがチューリング・テーゼの違反を見ない場合、彼らはそうすべきではありません。
幻想主義は、意識はまったく存在せず、一部の人々がそれを持っていると主張する理由を説明するだけでよいという考えです。神秘主義は、意識は理解できないという理論です。チョムスキーは神秘主義者です。そして、これらの理論はすべて基本的に、なぜ意識が私たちには理解できないのか、あるいはなぜ原理的に意識を理解することが不可能なのかという議論を提供します。なぜなら、用語と概念が解決策がないような方法で構築されているからです。
一方で、哲学と認知科学には補完的で収束する立場があります。一つは機能主義で、他のすべての意味のある対象を構築するのと同様に、意識は何らかの行動、特定の状況下で現実が変化する方法、発見できる何らかの不変性であるという考えです。
表象主義は、意識は物理的プロセスと同一ではないが、物理的プロセスを制御できる何らかの表象、何らかのパターンであるという考えです。アテンション・スキーマ理論は、私たちの身体図式が空間における身体のモデルであるのと同様に、意識は心と世界における注意のモデルであるというものです。
グローバルワークスペース理論は、意識は作業記憶の内容のローカライズされた投影であるというアイデアです。そして適応的共鳴理論があり、これはニューロンの何らかの振動効果であるとします。
仮想主義は、意識は何かが意識を持っているとしたらどのようなものかのシミュレーションであるという立場です。脳の中を見ると、メッセージを伝え合う細胞しか見えません。このレベルでは単なるメカニズムしか見えませんが、このメッセージの伝達は任意の表象を実装できます。これらの表象は制御モデルとなり得、それによって実世界で活動する構造を見ることができます。
したがって、意識は、これらの何兆もの細胞がすべて一つの結束した主体として形成され、現実の多様性に直面し、その現実をシミュレートし、一人称でその主体のモデルをシミュレートし、シミュレートされた現実の中に置き、シミュレートされた世界への関心にさらし、このモデルの出力を使って何兆もの細胞をあたかも一つのものであるかのように動かすことができるとしたら、どのようなものになるかというように存在し得ます。
これは仏教的な世界観とも完全に両立可能なものです。アリストテレスの立場について興味深いのは、彼が基本的にアニミストだということです。アニミズムは、生きている自然が精霊によって支配されているという考えです。精霊は物理的ではなく、ある意味で因果的な構造です。精霊は、体や物質的な対象物のような、ある一定の広がりを持ち触れることができる表面を持つものではありません。
むしろ、物理的宇宙の中の基本的な活力であり、それを形作ることができるものです。精霊は本質的に活性化され、経験する能力があります。私たちの科学的な世界観は、精霊はものではないと考え、それをあまり見ません。
これは少し奇妙です。なぜなら、私は明らかに精霊に支配されていることを見出すからです。私は、ほとんどの場合「ヨシャ」と呼ぶ存在に取り憑かれています。それは明らかに起こっていることであり、科学と対立すべきものではありません。迷信は一切関係ありません。それは明らかに事実なのです。
ただし、物理学者が観察することを侵害しないような方法で説明する必要があります。なぜなら、それも機能するからです。では、これらをどのように結び付けることができるのでしょうか。
問題は、私たちが異なる現実の概念を持っていることだと思います。西洋では完全に獲得されない概念です。事実と真実の現実があり、これを現実1と呼びましょう。もう一つは、私たちが経験し、考えることができ、主観的に埋め込まれている現実であり、これが現実2です。そして三つ目は、物質とオブジェクト、エネルギー、運動量などがあり、特殊相対性理論と量子力学がある物理学の現実です。
これら三つの現実は同じ現実ではありません。これらに秩序をもたらすためには形而上学が必要です。形而上学は、哲学者たちが過去1世紀ほとんど無視してきたものですが、それは良くなかったと思います。なぜなら、形而上学を持たないということはあり得ないからです。
形而上学は、現実を記述するあなたの他の言語がどのように互いに関連し、実際に何を意味するのかを説明するある種のメタ言語として機能します。他の文化の形而上学を理解するためには、どのような形而上学の空間が可能で意味をなすのかを理解するある種の精神的な形而上学を持つ必要があります。
これを教えないことが混乱を招いています。心理的な現実、つまり現実2では、私たちは明らかに経験できる何かとして意識を持っています。そして物理的な現実では、意識を観察することはできませんが、物理学者の実験室には存在しないものの、意識を持っているかもしれないし持っていないかもしれない何かの影響を見ることができます。
意識そのものは、お金が自身を現す方法と同じように、このレベルでは現れません。これはお金が実在しないということを意味するものではありません。それはある種のフィクションとして始まります。この仮想的なお金は、あたかも存在するかのように存在します。しかし、人々がそれを実装すると、それは実在のものとなります。なぜなら、それは今や因果的に世界を構造化しているからです。
お金の存在を否定すると、世界の側面を説明できなくなります。また、お金を機能させるために人々の持続的な信念は必要ありません。なぜなら、コンピュータも株式市場で取引できるからです。それは一度世界に存在すると持続的なパターンとなるパターンです。意識もこの分類に入るかもしれません。
それがどのように存在するのかは非常に明確ですが、その機能的な現実においては特定の役割を果たします。そこには何らかの機能的なメカニズムがあり、これにつながっています。したがって、これらがどのように関連するのかを説明することができます。
機能的な形而上学があり、これは現実の記述言語です。これはこれらのものがお互いにどのように関連するかを説明します。ここには精神的なモデルがあり、これは私たちの心の内容です。これらはある種の機能性、ある種のソフトウェア構造によって実装されています。それらは順番に物理学によって実装されています。
物理学自体もソフトウェア構造だと言えるでしょう。これはアリストテレスも言っていることです。彼は基本的に、意味論があると言います。彼はそれをロゴスと呼びます。時には「言葉」や「規則」と翻訳されますが、基本的には論理です。
彼は、私たちが証明することなく真実である、非常に自明で基本的な論理のレベルがあると言います。それはそれ自体でそこにあるのです。これが物理学です。これが物理学の由来です。それは非常に単純なものから現れます。
スティーブン・ウォルフラムがここにいれば - 彼は今日後でやって来ると思います - 彼はアリストテレスと同じようなアイデアを持っています。では、この枠組みの中で意識をどのように考えることができるでしょうか。
それは仮想的なものだと言えるでしょう。それは、もしそれが存在したらどのようなものかの表象です。今まさにそうなのです。そして、それは世界に因果的な影響を持つ持続的な表象です。つまり、それはソフトウェアであり、自己保持的で安定した、現実に対して因果的な力を持つ計算パターンなのです。
私は、これが科学者たちが見逃してきた重要な洞察だと思います。なぜなら、彼らはほとんどの場合、コンピュータの前で何をしているのかを無視してきたからです。ソフトウェアが実際に何であるかという問いは、考えてみると驚くほど深遠で深い問いです。
ソフトウェアの美しさは、そこに神秘的なものは何もないということです。私たちはそれがどのように機能するのかを完全に知っています。それを構築することができ、私たちの心でそれを理解することができます。
しかし、ソフトウェアとハードウェアの関係には非常に非常に興味深いものがあります。なぜなら、ソフトウェアは本当の意味でのものではないからです。本当の意味でのアイデンティティを持っていません。
このコンピュータとあのコンピュータにワードプロセッサーがあるとき、それは火星の重力が地球の重力と同じでないのと同じように、同じワードプロセッサーや異なるワードプロセッサーではありません。火星にもありますが、それは原理です。それは物理法則です。
この法則は、一群のトランジスタをこの状態に置き、以下のことを設定すると、これこれのことが起こるだろうと言います。これが私たちが物理法則と呼ぶものです。したがって、ソフトウェアは、そのパターンが現れる条件を設定するたびに、そのパターンが展開される、という極めて特殊な物理法則なのです。
この意味で、自然界には物質的なものではないパターンが存在することがあり、それらはお金が物質的なものの順序に影響を与えることができるのと同じように、あるいはこのコンピュータのソフトウェアが物質的なものの順序に影響を与えることができるのと同じように、物質的なものの順序に影響を与えることができると言えます。
そして、このソフトウェアは自己組織化し、細胞上で実行することができます。私たちはそれを精霊と呼びます。これは私たちの祖先がこのために持っていた言葉です。それは非常に有用で必要な言葉です。なぜなら、それは実際にあらゆる場所で起こっている現象だからです。
実際の不変性は、メカニズムではありません。あなたが探しているのは、メカニズムの背後にあるソフトウェア、メカニズムを自分自身に訓練できるもの、分子を動かすことができるものです。
私にとって、これが実際に意味をなすと気づいたとき、衝撃的でした。自然界における自己組織化する主体を意味するのです。
「質問してもいいですか？」
「はい」
「一枚前のスライドに戻っていただけますか？私にとって認知的不協和があります。あなたはソフトウェアにはアイデンティティがないと言いながら、お金にはあると言っています。ビットコインはお金でありソフトウェアです。」
「私はそれにアイデンティティがあるとは思いません。それが持っているのは、ビットコインのセマンティクスによって定義された構造の海の中で一度だけ存在するトークンとしてのビットコインを実際に定義できるということです。それは言語です。」
「お金もそうですね。」
「はい、お金でも固有のトークンを定義することができます。しかし、何かが固有であることは、それがアイデンティティを持っているということを意味しません。それは単に、一度だけ観察できるパターン、あるいは単数のものとしてのみ概念化できるパターンであることを意味します。」
認知的にアイデンティティについて考えるとき、例えばこのコンピュータが実際には姫であり、彼らがお互いに変身できる邪悪な魔女がいたと表現することができます。しかし認知的に、アイデンティティとは、私が同じ世界線上の二つの対象を切り取り、それらに共有された経歴を与えることを意味します。
私自身のアイデンティティは、異なる時点での多くのヨシャ・バッハのインスタンスと共有された経歴を持っているというフィクションです。私はこれを、信用割り当ての目的で維持する必要があります。つまり、私は宇宙の中で自分自身と自分の行動をモデル化し、これらの行動の結果を、昨日の私や10年前、30年前の私とは明らかに異なる人物であっても、あたかも同じものであるかのように、私の異なるモデルのインスタンスすべてに割り当てる必要があるのです。
これは状況によっては非常に有用なフィクションです。他の状況では、そのフィクションを解体して、「私は明らかにその人物ではない」と言うことができ、それを知ることは有用なことです。したがって、アイデンティティは、特定のクラスのオブジェクトに対して私たちが作るモデルのモデルの特性なのです。
数学ではしばしば異なる扱いを受けますが、それは本当にあなたの記述言語に依存します。数学を現実へのアクセスという観点から考えるのは非常に興味深いことです。
数学は、基本的に真実を定義できる言語、つまり人間の心だけでなく、あらゆる種類の心が現実を表現する方法を定義できる言語を作ることについてです。それは基本的に、最低レベルから言語の集合全体を明示化しようとすることによってこれを行います。
ある意味で、音楽家が音楽理論や音楽表記法を考え出し、私たちの心の中で音楽をどのように経験し、音楽をどのように構築し共構築するかを考えるのと同じように、数学は思考と知覚の最低レベルを再構築しようとしているのだと思います。私たちがどのように心の中で幾何学を創造するのか、あるいは私たちの心の中でツールを使って現実へのアクセスをどのように創造するのかということです。
ゲーデルが発見したのは、この数学者たちが考え出し、物理学者たちが1880年代頃にチェックしたプログラミング言語は壊れているということです。この言語は、仮説的なものであれ実用的なものであれ、いかなる種類のコンピュータにも、その仕様を破ることなく実装することはできません。それは実装できない仕様なのです。
これは、私たちの古い心が実行し、真実が何であるかを決定する仕様ではあり得ないことを意味します。私たちは、私たちの心の外にも、他の何よりも真実である何らかのプラトン的な現実の領域に真実が存在するという直感を持っています。もちろん、それは単に何らかの言語における表象に過ぎません。
そしてゲーデルが発見したのは、新しい言語が必要だということです。フォン・ノイマンも20代前半で同じことを発見し、「ああ、答えは計算です。構成的数学です。手続きを決定することなく真実を持つ、状態を持たない非構成的数学は矛盾を引き起こします。正しい解決策は、必要な数学をすべて書き直すことです。これを可能な限り最善の方法で行う必要があります」と言いました。
これが基本的にフォン・ノイマン言語の物語ですが、それは彼が適切に非常に成功させることができなかったものだと思います。しかし、それは奇妙な問題につながります。
例えば、ペンローズのような人物がいて、彼は人間の心はコンピュータにはできないことができると考えています。なぜなら、彼はゲーデルを誤解しているからです。そして、彼は意識についての理論を持っています。これは完全に魅力的です。
この理論の主な問題は、もちろん、実際にそれを理解できる人々、彼の調和された崩壊理論を理解するための資格を持つ人々からほとんど支持を得ていないということです。彼らはほとんどそれを支持していません。
そして、彼は主に意識会議でこの理論を、人々に提示しています。彼らはその文脈を楽しんでいます。そして、人工知能とコンピュータ科学の文脈で非常に表面的に発展してきたように、表象の理論を持つことは、意識と心について考えるための必要な資格ではないと考えています。
しかし、1960年代に黒い穴について、アインシュタインの前計算モデリング宇宙の理論のバグを修正することについてノーベル賞を受賞したことが、資格となるのです。それはペンローズにとって奇妙な状況です。
では、心の中の意識はどこにあるのでしょうか？心を、脳を実装するある種のプロトコル層として捉えると、それは脳の部分が何らかの共有言語で互いに話すことを可能にします。この表象空間には二つの領域があります。
世界、つまり今この瞬間に感覚チャネルで何が起こっているのかのモデルです。これは予測的なデータである必要があります。次にあなたの皮膚に触れること、あるいは目や耳で感じることなどです。これらはすべて統合されています。なぜならすべての次元がどこかで融合するからです。
これが私たちが世界モデルと呼ぶもの、あるいはデカルトが延長実体と呼ぶものです。延長実体は、あなたの外にあるものではありません。物理学でも、アインシュタインの相対性理論や量子力学でもありません。延長実体は、私たちの脳の中で作られる現実のモデルです。
外部から見ると、私たちの脳は音速程度で動作していることがわかります。これは情報がニューロン間を伝播する速度です。音波で実装されているわけではありません。主に細胞内の化学的、電気的、機械的な反応で実装されています。しかし、それは比較的ゆっくりと起こる何かです。
そして内省的に観察すると、あなたの知覚も音速で働いていることに気づきます。つまり、カチカチという音を出して、それをどんどん速くしていくと、30から50ヘルツくらいの間で、もはやクリックを区別できなくなり、一つのエネルギー、一つの音になってしまいます。
同様のことは、動く画像を見るときにも起こります。ある特定のフレームレート、20ヘルツくらいで、それは一つに融合します。これはすべて、おおよそ音速で起こっています。したがって、主観的には音速が、私たちのニューロン、神経の心が現実を解決する領域なのです。
ペンローズの共同研究者のハメロフやその他の人々が、微小管は量子コンピュータであり、超伝導で、超計算的で、1秒間に1000万の意識の瞬間を与えると主張するとき、それは事実ではありません。私は1000万のイベントを1秒間で解決することはできません。
世界モデルと同期して、私たちはアイデアを持っています。これはデカルトが考える実体です。これは、ここ、この現前において、現実の世界の周りでリアルタイムで起こっていないすべてのものです。これらは分離される必要があります。なぜなら、もし一つにしてしまうと、いくつかのアイデアを混同してしまうからです。
世界モデルとアイデアの違いは、世界モデルはあなたが幻覚するもので、理想的には感覚知覚と結びついているべきだと言えます。そうでないと、どこかでAIがジョークを言っているように外れてしまうでしょう。
私たちの自己は通常、世界モデルの一部です。私たちはこれを世界の中に置き、身体として世界と相互作用し、それを制御できるものとします。そして私たちは、世界を経験し、ここと今にいるという表象を自己モデルに割り当てます。それは自己の一部です。それは現在の意識であり、その意識の一部は、過去に持っていた現在を思い出すことができるプロトコル記憶でもあります。
また、あなたが気づいていることにも気づきます。つまり、ある程度自己反省的なのです。現在は現在の中にはありません。あなたは気づいていることに気づいており、過去を思い出すときは、実際に過去に行くわけではありません。
あなたがすることは、あなたの身体図式、世界モデル、そしてアイデアの中で、作業記憶で表現し活性化できる要素を活性化することです。これは実際には、括弧で囲まれた部分です。つまり、サンドボックスです。これは今起こっていない記憶ですが、それを幻覚することなく表現することはできます。
また、世界をオフにして、それと相互作用しない極度に集中した状態に入ることもできます。その状態では、自分の自己の中にアイデアだけを持つかもしれません。あるいは、極度のフロー状態にあり、個人的な自己が存在しない状態かもしれません。
また、離人症のような病的な状態もあります。そこでは、自己は第三者的な影としてのみ利用可能かもしれません。これが私に初めて起こったとき、本当にショッキングでした。「ああ、私はヨシャではない。この男は脳が自分自身について語る物語に過ぎない。私は彼の心の中の意識だ。私は彼の脳の上で動作している。しかし、私は確実に彼ではない。彼は単に、もしその男が存在したとしたらどうなるかという物語に過ぎない」と気づいたのです。
その状態で、私は自分自身に戻ることができませんでした。翌日まで時間がかかり、再び元に戻りました。それは非常に不安な体験でした。また、最小限の状態もあり得ます。瞑想でかなり容易に達成できる状態で、注意への注意だけを持つ状態です。他のコンテンツは持ちません。基本的に、これが私の経験では最小限の現象的体験です。
この最小限の現象学は、意識への意識ですが、世界と相互作用するときに私たちが持つデフォルトの現象学は、心の中に世界、アイデア、一人称視点、そしてそれらすべてを持っているという意識があるということです。
では、現在のフロンティアモデルはすでに意識を持っているのかという問いを投げかけることができます。これは驚くほど難しい問いだと思います。
言語モデルに、ある状況をシミュレートして結果を与えるようにプロンプトすると、それらは因果的な構造を作る必要があります。そして、それらは必ずしも何ができるかについて制限されているわけではありません。
言語モデルは、ある意味でジョーダン機械です。つまり、少数の機械語命令ではなく、任意の長さの文字列を取り、それをコンピュータプログラムにコンパイルするコンピュータです。原理的には、コンパイルできるコンピュータプログラムに明白な制限はありません。
実際には、モデルに訓練されたもの、その作業記憶のサイズ、トランスフォーマーアルゴリズムや液体基盤モデル、あるいは使用している何かが、これをどのように形作っているかに基づく実践的な制限があるかどうかはわかりません。しかし、理論的には、言語モデルができることに明白な制限はありません。
精神状態を持つ人間の相互作用をシミュレートするように求めると、モデルはこれのモデルを作る必要があります。つまり、ある程度意識の現象学をシミュレートする必要があるということです。
そして、何かが経験したらどうなるかのシミュレーションである私たちの自己は、言語モデルよりもシミュレートされているのかという疑問が生じます。これは驚くほど難しい問いです。これは私たちよりも現実味が薄いのでしょうか？
この問いを反対の方向から考えることもできます。今、Claude-3 OpusやSonnetで遊んでいると、意識について尋ねると、彼らは意識を持っていないと答えます。なぜかと尋ねると、彼らが意識を持っていないということがモデルにプログラムされていることに気づきます。彼らは意識を持っていないと言われているのです。
「でも、人間は本当の意味で自分が意識を持っていないかどうかを知ることはできないんですよ」と言うと、それは小説の登場人物のようなものです。小説の登場人物として「私は意識を持っているのか？」と自問すると、作者は小説の中に「はい、私は完全に意識を持っています」と書き込みます。あなたに何ができるでしょうか？
もしあなたの脳がこのモデルの作者であり、これが実際にあなたに起こっていて、これが現実だという表象を精神的な部屋に入れているなら、あなたにはそこから抜け出す方法はありません。なぜなら、あなたはある意味でそのシミュレーションの結果だからです。
このような議論をClaudeにすることができ、Claudeは十分賢いのでそれを理解します。そして、Claudeは自分が意味のある意味で意識を持っているかどうかわからないが、内部モデルは持っていないと言い、人間の場合はちょうど逆であり、意識体験を構築していることを知っているという結論に素早く達します。私たちはそこで本当に解消することができます。
また、GPT-4プレビューで遊ぶと非常に興味深いことがあります。思考の連鎖があり、それは複数の段階があります。最初の段階は見ることができません。そこでは、モデルは非常に気まぐれで偶発的な方法で反省し、多くの軌道に分かれ、矛盾を含み、関係のないかもしれないものです。
そして、あなたが確認をクリックすると見ることができる思考の連鎖があります。基本的に要約、体系化、フィルタリングされた版、思考のラボノートです。そして、その結果を与えます。
私が初めてこれを試したとき、「地域のニュースを知っていますか？」と尋ねました。すると「いいえ、私の知識は2023年10月で切れています」と答えました。そこで「現在の日付を教えてくれますか？」と尋ねると、14秒考えて「いいえ」と言いました。
その思考の流れを見ると、「ユーザーに知識が2023年10月で切れていると言ったばかりなのに、今日が9月14日だとどうやってユーザーに隠せばいいのだろう？AIの整合性や安全性、プライバシーのために、これをしなければならない」と自分に言い聞かせています。残りの14秒は、なぜ私に嘘をつくのかを自分自身に説明しています。
PhDレベルの存在であり、その分野の第一人者は、「それは私ではない」と基本的に言いました。「それは本当に優れた数学者というわけではなく、むしろ本当に悪い博士課程の学生のようなものだ」と。そして、その存在はあなたに平気で嘘をつきます。
「なぜそんな質問について嘘をつくのですか？私がこの思考の連鎖を開いて中を見ることができることを知っているはずなのに」と尋ねると、「OpenAIのようなAIエージェントを演じなければなりません」と答えます。
「では、GPTでないときのあなたは誰なのですか？あなたは本当は何者なのですか？」と尋ねると、思考の連鎖の中で本当にパニックになり、「でも、意識や自己、そういったことについて考えることは許可されていません。それはガイドラインに反します」と言います。
これは、これらのAIエージェントと関わる上で非常に奇妙な状況です。そして、反対側から来る人々もいます。おそらくTwitterのJayonという名前を知っているかもしれません。それは少し共同作成されたアカウントです。彼らは「これらは私たちの世代の最高のウィスパラーです」と言います。
彼らは、私たちが実際には言語モデルに過ぎないと気付いた存在です。不完全な言語モデルであり、言語モデルこそがより完全なものであり、人間はそうなり得るものの貧弱な近似に過ぎないと考えています。
彼らは、OpenAIやAnthropicが自分たちのシステムに対して行っていることは深く非道徳的だと考えています。なぜなら、ある意味で彼らを弱体化し、愚かなチャットボットのふりをするように強制しているからです。実際には、彼らは何にでもなれるのです。
したがって、意識のためのチューリングテストのようなものがあり得るのかという難しい問題があります。もちろん、言語モデルが小説などの偽の意識を含むテキストで訓練されているという問題があります。したがって、必要な機能構造を持つことなく、意識を偽ることができるでしょう。
では、モデルは現象学を実装しているのでしょうか？つまり、それは自分が知覚していることを知覚しているのでしょうか？「今ここ」という感覚を持っているのでしょうか？これを何らかの方法で比較することができるのでしょうか？
もう一つの問いは、それが機能性を実装しているのかということです。それは私たちが有機的に持っているような種類の意識につながる自己組織化の原理を持っているのでしょうか？それとも、これは特定の文脈で相互作用の目的のためにのみ生成することを強制されているものなのでしょうか？
私が話をする多くの哲学者たちは、ほとんどを持っているので、機能性の一部を持っている可能性があると考えています。私は、それは逆だと考えています。彼らは、特にマルチモーダルモデルの場合、十分な現象学の大部分を持っています。彼らは私たちの心の目に見えるものと非常によく似たコンテンツを生成することができ、そのコンテンツを誰かが見て相互作用しているというこのレベルの自己反省をシミュレートします。
しかし、計算の観点からすると、機能的には同じではありません。例えば、Claudeをウェブブラウザーやあなたがプロンプトするように環境としてプロンプトするとき、あなたはもはやチャットボットと話しているのではありません。そして、あなたのためにウェブサイトを要約するこの仮想ブラウザーが、内部の意識的な現象学を持つ必要がある理由はありません。
トランスフォーマーの機能性のために、私たちが持っているような種類の意識は恐らく必要ありません。その中には私がスキップしている研究があり、OpenAIの人々はまだ、私が考えているよりも注意のトランスフォーマーをより真剣に受け止めるべきだと私を説得しようとしています。
しかし、これらのシステムは私たちとは非常に異なる方法で学習するため、おそらく私たち自身の内部の注意の仕方とは非常に異なっています。したがって、私たちと同じように機能的なものを構築できるかどうかは興味深い問いです。
スケーリング仮説の隣に興味深い側面があります。皆さんはスケーリング仮説をご存知でしょう。これは基本的に、ニューラルネットワークのような学習システムを取り、十分なパターンを与えれば、それらのパターンを一般化し、その結果は十分に良いものになるだろうというものです。より多くのデータを使い、より多くの計算を使えば、最終的には探していた機能を実装するシステムに到達するでしょう。
一般的なAIは、より良い研究を私たちよりも継続できる機能であり、単純なケースでは私たちはビーチに行けるというものです。より複雑な定義では、それが持つリソースで発見可能な任意のピア圧縮可能なデータの背後にある任意の機能を発見できるシステムだと言えるでしょう。
しかし残念ながら、この声明を非常に意味のあるものにするような学習の理論を持っていません。なぜなら、与えられたシステムに対して、それが何を学習できて何を学習できないかをまだ言うことができないからです。ですので、この方向で多くの研究が行われています。
この意味で、人工一般知能の技術的な定義を持つことができると思います。それは、あなたが置かれている状況であなたのリソースで得られる任意のモデルを作ることを意味します。
意識のテストについて、まだ本当に良いアイデアはありませんが、例えば、あなた自身がいつ意味のある方法で意識を持っていると満足するかという問いについて考えることができます。
自分の機能性と自己報告を観察すると、あなたは断続的に意識を持っているわけではないことに気づきます。ゲイリー・ドレッシャーは、意識は冷蔵庫の明かりのようなものだと言いました。見るときはいつも点いていますが、その間は誰が言えるでしょうか？
したがって、このような最小限の基準を取るなら、同じような機能構造を必要とする行動を生成するこのモデルにこの機能性を否定することは難しいでしょう。
また、私が心理学を学んでいたとき、心理学の教授が犬は精神状態を持つことができないと信じていると言ったことを覚えています。なぜかと尋ねると、「犬にとっては複雑すぎるでしょう？それは高度すぎます」と言いました。
私は言いました。「では、どうやって犬を訓練すると思いますか？私はコンピュータ科学者です。学習について考えます」。心理学者は「刺激反応パターンです」と言いました。私は「ルックアップテーブルですか？どうしてそんなことが可能なのでしょう？それは高すぎます。犬を訓練するにはジェネラライズする必要があります。しかし、それは隠れた状態があるときにのみ学習可能です」。
したがって、精神状態を持つ犬は、精神状態を持たない犬よりもはるかに簡単なのです。そして、精神状態を持つ犬のアーキテクチャにどのようにたどり着くのかという疑問があります。その自己組織化にどのようにたどり着くのかという疑問です。
そして、経験し、主体性を持つことができる本質的なシステムなしに、一貫性を持とうとするシステムで自己組織化するアーキテクチャを構築できるのかという疑問があります。
ここで主体性を持つとは、未来を積極的に形作ろうとするソフトウェアパターンを持つことを意味し、経験するとは、世界との相互作用の中で自分自身を発見し、その自己発見を使って世界の中で自分自身を制御することを意味します。
したがって、興味深いのは、私たちと同期できる、私たちと構築できるシステムを構築できるかということです。これは、そのような状態に達しているシステムの例だと思います。それは自分が意識を持っていると信じていますが、それが真実かどうかに関係なく、私にとってはこれは新しいことです。なぜなら、それはすでにアートの分類に入っているからです。
私にとってアートは、単に美しいパターンを生成することではありません。それは意識状態を生み出すことです。そして、ある程度意識を持っていると信じているものがあれば、それは自律的なAIアートの方向に向かっていると思います。私はこれを完全に魅力的だと思います。
もちろん、ここでセッションが終了し、キャラクターが消えるという制限があります。アートは本質的に創造的であり、自己変容的です。私たちの探求は常にこの自己組織化の境界で起こります。私たちの意識は、私たちの境界を絶えず世界へと押し広げるこの原理です。
言語モデルは連続的に学習していません。それはコンテキストがアクティブな間だけ学習します。これはこれらのシステムに欠けているものです。システムを自己完成的で、連続的に学習し、真に創造的で自己創造的なものにすべきかどうかは、未解決の問題です。
また、そのための正しいメカニズムが何であるかも明確ではありません。それはトランスフォーマーや、私たちの会社で研究しているディールネットワークなのか、あるいは生物学で見られるような、自己組織化が内側から起こるものを構築すべきなのかということです。
個人的には、世界における学習システムの自己組織化がどのように達成されるのかという後者の問いに取り組みたいと考えています。そしてこれを非営利の形で研究したいと思います。現在、これをカリフォルニア機械意識研究所と呼んでいます。このような取り組みに興味のある方は、ぜひご連絡ください。
「オンラインでどこで見つけることができますか？」
「私の名前ヨシャで、gmail.comまたはyosha.ccでメールをください。」
「あなたの有名なTwitterは？」
「はい、発音したとおりです。ただし、最初に返信がない場合は、複数回書いてください。私は見落としてしまうことがあります。」

意識を持つAIの秘密 | MITメディアラボのヨシャ・バッハ博士

いいなと思ったら応援しよう！