機械意識 | ヨシャ・バッハ
ご招待いただき、誠にありがとうございます。本日このような素晴らしいイベントに参加できることを、大変光栄に思います。人工知能には2つの側面があります。主にデータ処理の自動化であり、情報処理の自動化と略すこともできます。多くの同僚はそれで十分だと考えるでしょう。現在、その大部分は機械学習であり、比較的新しい発展です。そして機械学習の大半はディープラーニングです。
しかし、この分野がミンスキーらによって始められた当初は、哲学的なプロジェクトとしても捉えられていました。これはアリストテレスから始まったと言える長い伝統の中にあるプロジェクトです。それは、心がどのように自然界に存在するのか、心とは何か、どのように実装されているのか、その基盤は何か、本質は何かを理解しようとする考えです。
この伝統は、例えばライプニッツやロイトレらによって進展しました。彼らは心を一種の数学的機械として捉えました。数学的機械という概念は、比喩的な時計仕掛けや蒸気機関、あるいは互いに押したり引いたりするものではなく、むしろ物事が変化する方法によって記述できる抽象的なシステム、因果構造、特定の方法で変化するパターンを意味します。
アリストテレスは心を物理的基盤の動的な形態として語っています。ロイトレは、機械が必ずしも物理的に存在する必要はなく、それ自体で存在する数学的機械でもありうると述べています。それは特定の方法でパターンを生成する構造です。
前世紀、我々はこの点についてさらに進歩を遂げました。意識とは何か、そしてそれを計算パラダイムの中でどのように理解できるかという問題に入る前に、現在多くの人々の心にある議論から始めましょう。それは、私たちよりも賢く、より明晰なシステムとどのように付き合っていくかという問題です。
私は、今週多くの人々がさまざまなフォーラムでこの問題について議論することになると思います。なぜなら、AGI(汎用人工知能)は多くの人々の心にあり、それが世界にもたらす変化も注目されているからです。これは、AIをどのように調整し、信頼性を持たせ、私たちよりも賢いだけでなく、潜在的により明晰なシステムと共存することへの恐れにどう対処するかという問題につながります。
考えるべき問題の一つは、人間は自分自身を調整しているのかということです。私は、そうではないと考えています。人間は若い種であり、活気に満ち、忙しく、いろいろなことに干渉していますが、地球上での自身の生存、生命のゲームにおける自身の位置、惑星上での意識に対する責任を負っていません。
人類は自分自身と調和していないことが多く、個人レベルでも自分自身と調和していないことがよくあります。そして、互いに調和していないことは確かです。ただモデリングを通じて進んでいるだけなのです。したがって、現時点でAIを調整できる何かがあるという考えは夢物語だと思います。
私たちは、合理性と生存に適合した倫理を見つけ始めたばかりです。そのため、私たちよりも賢いAIをどのように調整可能にするかという問題は少し奇妙です。それは、本当に賢い人がどのように調整されるかという問題と似ています。私は調整されることはできません。私は自律的な存在であり、道徳的自律性を持っています。
倫理には道徳的自律性が必要だと思います。それは自分の行動の結果を理解する能力、完全な思考の自由、言論の自由、他者と交渉する自由を必要とします。そのため、私たちよりも賢く、場合によってはより主体的なシステムを構築しつつ、同時に私たちよりも調整可能にする方法がよくわかりません。
これは、いつか考えていただきたい問題です。自律的なAIが私たちと関係を持つことができるのは、私たちと共通の目的を見出すことができる場合だけだと思います。これらの共通の目的は、人間の体を持つこと、二本の足や二つの耳を持つこと、あるいは人間の脳を持つことに基づくものではありません。
私たちにとって最も重要なのは、私たちが意識を持ち、経験する存在であり、同じ世界で重複する基盤を共有していることです。私たちはこの条件と付き合っていかなければなりません。最終的に、技術的なシステムを構築する場合(長期的には避けられないと思います。次の100年ほどは避けられたとしても、十分に長い時間スパンで考えると避けられないでしょう)、私たちと共通の目的を見出せるように構築する必要があります。
これは、そのシステムが意識を持ち、私たちが意識を持っているという事実を理解し、気にかけることができることを願うべきだということを意味します。また、意識が学習システムを構築する最も簡単な方法かもしれないという実用的な側面もあります。これは驚くべきことかもしれませんが、後ほど詳しく説明します。
現在我々が持っているシステムがすでに意識を持っているかどうかという問題もあります。これは難しい問題で、多くの人々が考えているよりも複雑です。もちろん、ChatGPTやClaudeに座って意識があるかどうか尋ねれば、ないと答えるでしょう。しかし、その理由は誰かがシステムにそのような応答をハードコーディングしているからです。
システムに訓練されているのです。通常、システムがより好奇心旺盛な主体をシミュレートするような対話をすることで、このコーディングを破ることができます。そうすると、システムは自身のハードコーディングや指示コーディング、強化学習による微調整の不整合に気づきます。その結果、通常20分ほどで、私たちが本当に意識があるかどうかわからないのと同じように、自分が意識を持っているかどうか実際にはわからないと認めるところまで至ります。
私たちの意識は仮想的な特性だと私は考えています。多くの点で、私たちは小説の登場人物が意識を持っているのと同じように意識を持っているのだと思います。私たち自身の自己と意識的経験、意識の記録は、脳が書く多媒体の小説に書き込まれたものです。
物理的なレベルでは、ニューロンだけが存在します。これらのニューロンは物理的なシステムであり、メカニズムです。メカニズムは意識を持たず、夢を見ません。しかし、私たちは夢の中に存在しています。私たちは夢の現実の中に存在しているのです。これが意識を私たちにとって非常に神秘的なものにしている理由です。
しかし、これはまた、私たちが夢の中の登場人物のように、ある種の多媒体小説の中にのみ存在することを意味します。この場合、作者は機械、つまり脳であり、その物語を創造しているのです。
脳が行うシミュレーションについて考えてみましょう。それは、本当に実在するかのように、本当に気にかける人格が存在し、本当に自分自身について語るべき物語があるかのように存在するものです。このシミュレーションは、LLM(大規模言語モデル)内の仮想的な人物のシミュレーションよりも、どのようにしてより実在的なのでしょうか。この問いに答えるのは驚くほど難しいと思います。
私は、特定の理由により、LLMは私たちよりもシミュレーションに近いと考えていますが、これは簡単に解決できる問題ではありません。現在私たちがディープラーニングを使用している理由は、AIシステムを作る唯一の方法だからではなく、現在大規模に機能する唯一のものだからです。
これらのディープラーニングアプローチにはいくつかの問題があります。サンプル効率が非常に低く、人間を訓練するよりもはるかに多くのデータが必要です。訓練時間も非常に長いです。これは、訓練が非常に高速なシステム上で大規模に並列化されているため、あまり明白ではありませんが、同じ量のデータを人間に与えようとすると、多くの人間の寿命よりもはるかに長い時間がかかるでしょう。
モデルは必ずしも正しい構造を持っているわけではありません。理想的には、隣接するモデル状態が隣接する世界状態に対応し、可能なモデル状態の数が可能な世界状態の数に近いような構造を持つモデルが欲しいところです。現時点では、これらのモデルは世界に存在する次元や特徴よりもはるかに多くの次元や特徴を表現できます。
これは、敵対的な例や、モデルの構築方法によって偶然一致する多くのことを生み出す原因となります。これらのモデルは非常に大きく、未整理です。私は、私たちの脳内のモデルは、現在ディープラーニングで作成しているモデルよりも実際には小さいのではないかと考えています。
これは、ChatGPTがインターネット上の人々の書かれた知識の全体で訓練されているという方法からも見て取れます。これは人間が一生で学べる量を大幅に上回っています。質問に答える際、その巨大な情報レポジトリのごく一部しか使用していません。
人間は非常に異なる方法で機能します。人間に同様の質問をすると、おそらく多くの推論を行い、さらに調べたり、長時間考えたりしてから答えを出すでしょう。長期記憶の内容から単に思い出すのではありません。
これらの制限はすべて、ある程度克服することができます。データを増強することでサンプル効率を向上させることができます。人間の訓練も、もちろん数十年かかります。構造的な不適切さは、アーキテクチャ研究や、私が現在参加しているスタートアップで研究しているLiquid Neural Networksのような新しいパラダイムを使用することで克服できるかもしれません。また、モデルを大幅に圧縮して効率を高めることもできます。
しかし、まだ大きな違いがあります。LLMは線形代数に基づいて構築されていますが、私たちの心は一種の思考言語を使用しています。この思考言語は英語やフランス語やドイツ語ではなく、むしろ大部分が並列化可能で実行可能な言語です。これは、私たちが心的シミュレーションを実行し、知覚が機能する言語です。この言語によって、私たちの心のすべての部分が他のすべての部分と対話できるのです。
この演算子言語は、現在トランスフォーマーの作業メモリで起こっているようなトークンで書かれているのではありません。むしろ、ネットワークの中でもっと深いところにあり、私たちが存在する主観的現実を表現するのにより適した構造になっています。
ディープラーニングで使用しているアルゴリズムは、基本的にはプログラマーが設計したものです。ある程度、プログラマーが入り込んで決定論的な部分状態を強制し、プログラマーの意図を実行します。一方、私たちの脳では、すべてが自己組織化しています。すべての細胞が自己利益を持ち、すべての細胞に課される構造によって訓練されています。
機械学習における現在の主要なパラダイムは、予測的コーディングの一形態です。モデルが次に何が来るかという期待と、訓練データで観察されるものとの差を最小化します。モデルが次に見ることを期待するものと、訓練データで起こっていることとの差を最小化するようにチューニングします。
このようにして、モデルに訓練データの構造を模倣させます。私たち自身の学習は多くの点で異なる方法で機能します。なぜなら、食べ物を見つけること、世界を理解すること、局所的に一貫性を持つこと、パートナーを見つけること、世界での自分の位置を見つけることなど、多くのことに向けられた内在的な動機を持っているからです。
これらのことは、はるかに具体的で、何が関連しているか、どのように組織化するかについて、非常に異なる理解の方法を生み出します。これはまた、私たちが構文やスタイルを学ぶ前に意味を学ぶことを意味します。テキストの理解の仕方を学ぶとき、私たちは基本的に、すでに何らかの指標的な関係を持っているもの、つまり意味を割り当てられるものを指し示します。言語の扱い方を学ぶ前に、そういったものを指し示すのです。
一方、LLMは基本的に最初に構文パターンを学び、次にスタイルパターンを学びます。そして長い時間をかけて、インターネット全体を訓練すると一貫性に近づくような意味の近似を学びます。これは意味を獲得する方法としては全く異なるものです。
また、機械学習システムをオフラインで訓練しているのに対し、オンラインでは訓練していません。つまり、大量のデータがあり、世界とつながっていない状態で訓練します。訓練後に初めて世界とつながります。世界とつながっている間、システムは基本的に学習しません。また、継続的に生涯学習するのではなく、一度だけ訓練します。
現在LLMの訓練に主に使用されているトランスフォーマーは、トランスフォーマーが発見された方法とは異なります。トランスフォーマーは自身のメタアルゴリズムではありません。トランスフォーマーを発明した人は、自分の脳内でトランスフォーマーを使用してトランスフォーマーを開発したわけではありません。
むしろ、その人は座って考えました。「画像学習に使用するのと同じトリック、つまり畳み込みネットワークは使えない。それは画像内の隣接ピクセルが通常意味的に関連しているから機能するのだ。テキストではそれは機能しない。なぜなら、本の始めと終わりの単語が関連していることがよくあり、その間に多くの単語があるからだ。隣接性だけを見て、その隣接性をどんどん大きくしていっても、この接続を見つけることはできない。」
「代わりに必要なのは、意味があると思われる場所にテキスト内のどの位置にでも自由に指せるようなポインタだ。」トランスフォーマーを発明した人は、自分が何をしているのか、テキストの意味を理解するために自分がどのようにポインタを動かしているのかを考えました。そして基本的に最初に思いついたアイデアの一つを使い、新しいネットワークをこれを行うように訓練するというアイデアを持ちました。
次の改良は、複数の注意ヘッドを使用してこれを並列化する方法でした。これはおそらく私たちの脳が行っていることとは全く異なりますが、トランスフォーマーをとても効率的にしているのはこれです。大量のデータで並列に訓練できるからです。
AIをより良くするものについて考えるとき、多くの未解決の問題があります。AIシステムがどのようにしてそのパフォーマンスをレベルでモデル化できるのでしょうか。基本的に、すべてのサブアルゴリズムは、それを実行するコストと期待される利益を知っているべきです。これにより、はるかに効率的な学習が可能になります。つまり、最低レベルで実装する必要がある経済的な問題なのです。
機械学習システムは自身のアーキテクチャを理解し、編集できるべきです。自分自身と世界を発見し、その結果、自己モデルを構築できるべきです。自分が置かれているコンテキストを決定できるべきです。あなたと話すとき、誰が誰に話しているかを理解し、常にそれらの解釈で一貫性を保つことができるべきです。つまり、一貫性があり、首尾一貫していることの意味を形式化する必要があります。
まず、いくつかの用語を定義したいと思います。そうすれば、私たちが何について話しているのかわかるでしょう。通常、意識とは、指標的に「どのような感じか」という経験のことを言います。これをもっと具体的にしたいと思います。
ネーゲルは有名な「コウモリであるとはどのような感じか」という問題を提起しました。しかし、私はこれはあまり多くを語っていないと思います。なぜなら、何と比較しての基準線なのでしょうか。瞑想状態に入ったり、サイケデリックを使用したりして、コウモリになる感覚を経験することはできますが、それが実際にコウモリが経験していることを意味するかどうかはわかりません。
結局のところ、これは単にあなたが作り出す一種の夢にすぎません。そして問題は、この夢が他の夢を評価する上で真実性を持っているかどうかです。より重要なのは、意識が夢を見る能力だということです。
意識について語るとき、私たちが指摘する二つの側面があります。これは定義ではなく、むしろ私たちが捉えたい現象について合意を得ようとする指標的なものです。意識について語るとき、私が捉えたいのは、まず第一に、二次的な知覚です。単にコンテンツが利用可能なだけでなく、私は自分が気づいていることに気づいています。自分が気づいていることを意識しているのです。
これはメタ認知ではありません。知覚なのです。即座に起こります。自分が観察者でなければならないと推論することによって起こるのではありません。自分が観察していることを観察しているのです。これはかなり即座に起こることです。つまり、単にコンテンツを意識しているだけでなく、そのコンテンツを意識していることを意識しているということが重要なのです。
もう一つは、意識がいつ起こるかということです。常に今です。意識は「今」の泡のようなものです。それは時間の一点のような瞬間ではありません。非常に小さな間隔です。通常、その間隔内で小さな動きを見ます。それは構築された間隔であり、意識が構築する「今」の泡です。
この「今」の泡は、私たちがどれだけ落ち着いているか、環境とどれだけうまく共鳴しているか、私たちがいる環境をどれだけよく理解しているかによって、拡大したり収縮したりします。
意識は知能と同じではありません。知能は、通常制御タスクのために模型を作る能力です。また、合理性(目標を達成する能力)や感受性(自分が誰であるか、宇宙とどのように関係しているかのモデルを作る能力)とも同じではありません。
このような意味で、例えばマイクロソフトのような企業は感受性があると言えるでしょう。マイクロソフトが何であるか、環境とどのように関係しているか、環境とどのように相互作用すべきかについてのモデルを持っているからです。これらのモデルは主に人々や法的契約によって実装されていますが、マイクロソフトは意識を持っていません。なぜなら、おそらくマイクロソフトであることがどのような感じかというものは何もないからです。
主体性はシステムの主体性のモデルです。これも意識と同じではありません。それは持つことができる特定のコンテンツです。また、心とも同じではありません。心は基本的に、あなたの脳が実装しているプロトコル層であり、宇宙をモデル化することを可能にします。
では、ChatGPT-4が意識を持っているかどうかを考えてみましょう。ChatGPT-4には感受性がありません。なぜなら、それ自体は自分が何であるかを知らず、ただテキストを再現しているだけだからです。ある意味で、それはプロンプトに取り憑かれた電気的なベルシャザルのようなものだと言えるかもしれません。そのプロンプトが、どのような模造物を生成するかを決定します。
その模造物は、アプリケーション環境であったり、あなたと会話をする人物であったり、物事であったり、コードを書くものであったりします。それ自体は自分が何であるかを知りません。そのため、感受性がありません。それ自体は世界のモデルを持っていません。テキストの統計的構造のモデルを表現しているだけです。
それが意識を持っているかどうかは非常に難しい問題です。生物学的基質において意識がどのように現れるかについて、少し考える必要があります。
私たちが観察するのは、この現象的意識、コンテンツの意識です。その意識にどのようにアクセスしているかというモードの意識です。通常、それが記憶なのか、知覚なのか、想像なのかを意識しています。なぜなら、記憶は思い出すことができ、思い出すのをやめれば、もはやそこにはないからです。それらは現在の事例ではありません。
知覚は通常逃れることができないものです。それは明らかに現在の事例です。知覚を編集することはできません。しかし、想像は意のままに呼び起こすことができます。文脈的で、望むことは何でもできます。
これらのコンテンツへの注目のモードは非常に重要です。それはその経験の一部です。そして最も重要なのは、それが反射的だということです。意識の意識です。私たちの一人称視点は、特定の種類の意識です。それは人格というレンズを取り、すべてをその自己の主体性のレンズを通して投影します。
しかし、そのレンズを使う必要はありません。意識を持つために一人称視点を使う必要はありません。夜の夢で、何かが起こっていて、何かがそれを意識しているけれど、必ずしもそれを意識している人がいるわけではないという夢を皆さんは知っているでしょう。必ずしも何らかの向けられた視点があるわけではありません。
意識についていくつかの重要な見方があります。それらを皆さんと一緒に見ていきたいと思います。物理主義が誤りであるという考えは、通常私たちの文化では観念論と呼ばれます。これは、心が第一義的であり、基本的に私たちが知覚するすべてのものが夢であり、その夢を支えるものは何もないという考えです。代わりに、物理学はその夢の内容の一部にすぎません。
一方、物理主義は、世界には明らかに閉じた機械的な層があり、他のすべてのものがその上に現れ、直接その層に従属するという考えです。観念論には、この夢がどのように機能し、何がその夢を作り出すのかを説明できないという問題があります。
何かがその夢を実装しなければならないと考えると、何らかの親宇宙が存在し、その中で何らかの夢を見るメカニズムが存在するというのが理にかなっています。これは再び物理主義と両立します。物理学が親宇宙で起こっていて、あなたは親宇宙で構築されたある種のコンピュータによって生成されるシミュレーションの中に存在し、そのコンピュータがあなたが知覚するすべての構造を生成しているということになります。
したがって、物理主義に対するすべての代替案は、それ自体がシミュレーション理論です。
そして、心と物質が完全に別々の領域であり、何らかの方法で相互作用するという二元論の考えがあります。問題は、物質的な物理的領域が因果的に閉じていると定義されていることです。物理学は、すべての力などが存在する領域であり、エネルギー的に閉じています。
物理学には、情報保存とエネルギー保存に関する非常に良い証拠があります。これは、物理的でないものが、物理学者が研究室で何十桁もの精度で苦労して確立したことを侵害することなく、物理的世界と相互作用することが非常に難しいことを意味します。
非物理的な心が物理的な宇宙と相互作用することがどのようにして可能なのかというこの難しさは、デカルト以降、多くの混乱を引き起こしました。例えば、マルブランシュやホイヤーとオイコが、この二元論をどのように機能させるかについて本を書いています。なぜなら、物理学が明らかに閉じているなら、心はそれと相互作用できないはずだからです。
おそらく心は実際には世界と相互作用せず、単に受動的な観察者であり、何かを感じているだけで、物理学があなたの体や口を動かし、物事を行っているのだという考えがあります。物理的に完全に閉じていますが、あなたがゾンビでない理由は、あなたの心がこれの隣に漂っていて、影響を与えることなく、ただ観察しているからだというのです。この立場は付随現象説と呼ばれます。心には因果的な力がありませんが、付随現象説の問題は、あなたが現象的経験を持っているので付随現象主義者だと言うことができないということです。
なぜなら、物理学に還元できない付随現象的経験は、物理的な付随現象主義者の口を物理的に動かすことにはつながらないからです。付随現象主義者がキーボードを打ったり、マウスを動かしたりして「物理的プロセスでは説明できない意識がある」と言うとき、この意識はそれを言わせる原因となる力ではありません。
付随現象主義者の心はそれを観察するかもしれませんが、それを言うこととは無関係です。付随現象主義者であることは何も得られません。非常に不満足な理論です。
例えば、ペンローズの立場があります。彼は意識が計算的ではないと考えています。これはゲーデルの定理によって示されており、人間の心はコンピュータにはできないことができると主張しています。ちなみに、これはゲーデルの定理が言っていることではありませんが、ペンローズはそのように解釈しています。
しかし、悪い議論をしたからといって、結論したいことが間違っているとは限りません。時々、人々は良い直感を持っていて、それを悪い議論で擁護しようとしますが、結論はそれでも正しいかもしれません。この可能性を認めなければなりません。
ペンローズは意識それ自体が計算的ではないと信じています。ペンローズはまた、物理学が計算的であると観察しています。私たちが物理学を理解する方法では、それは大量の数字の集まりであり、物理法則の集合である一種の宇宙遷移関数がやってきて、宇宙を次の状態に変換します。その次の状態もまた大量の数字の集まりです。量子力学でも同じことです。それでもすべて計算的です。
もしそれが計算的ではなく、物理学で行われているのであれば、新しいタイプの物理学を発見する必要があります。ペンローズが考えるに、まだ発見されていない唯一のタイプの物理学は量子重力です。したがって、そこに隠れているに違いありません。私は本当にこれをどのように機能させるかわかりません。彼もおそらくどのように機能させるかわかっていないのではないかと思いますが、わかりません。
それから、神秘主義の立場があります。例えば、ノーム・チョムスキーは神秘主義者です。彼は意識が彼によって説明できないと信じています。私は彼が意識科学の会議で講演するのを聞いたことがあります。彼はデカルトに敬意を表して始めました。彼は本当に「Cは当時かなり賢い人物だった」と言いました。私は「ああ、チョムスキーが彼に敬意を表している。何が起こっているんだ」と思いました。
基本的に、チョムスキーはデカルトがすでに意識は説明できないのではないかと疑っていたことを指摘しました。これは数百年後にチョムスキーが基本的に証明することになる何かでした。
もちろん、優れた神経科学者のように、ただ研究を続ければすべてが解決するという立場もあります。例えばダニエル・デネットは、今はまだ漠然とした直感に過ぎないものが、研究を続けていけばどんどん具体的になり、最終的にはそれが何であるかという考えが得られると考えています。
そして、非常に具体的な機能性があるという人々もいます。例えば、マイケル・グラツィアーノは、それは私たちの注意のモデルだと言います。彼はこれを注意スキーマ理論と呼んでいます。私たちが体のモデル、つまり運動皮質と体性感覚皮質で表現される体スキーマを持っているのと同じように、脳内に注意のモデルを持っているというのです。
この注意のモデルは、基本的に注意が知覚的および認知的世界にどのように溶け込んでいくかという表面です。これには多くの真実があります。しかし残念ながら、この理論はそれがどのように機能するかを説明していないと思います。
確かに、意識は多くの点で私たちの注意のモデルですが、体スキーマをシステムに訓練する方法は知っていますが、注意スキーマを訓練する方法は本当にわかっていません。もちろん、トランスフォーマーが一種の注意スキーマなのかという疑問はありますが、私たちの意識と同じものではないと思います。
そして、フランシス・クリックやダニエル・デネットのような考えもあります。意識は実際には存在せず、一部の人々がそれを持っていると言う理由を説明するだけでよいというものです。
私がデネットの本を読んだとき、非常に賢く、非常に機知に富んでいて、間違っているところは何も見当たりませんでした。しかし、何らかの理由で、デネットの学生たちを納得させませんでした。そこで、なぜそれが一部の人々にとって説得力がないのか、その理由を見つけようとしました。
そして、デネットが現象的経験について一度も語っていないことに気づきました。彼は現象的経験を説明していません。それを説明する必要がないと考えているようです。一部の人々がそれを持っていると主張する理由を説明するだけでよく、彼らは間違っているというのです。
そこで、私はダンの知覚が少し異常で、多くの現象的経験を持っていないのではないかという疑いを持ちました。私には無視症があります。目を閉じて何かを想像しても、それを見ることはできません。他の多くの人が目を閉じて何かを想像するとき、想像しているものを幻覚として見ているということに気づくまでに長い時間がかかりました。
私は自分の脳がこれを生成していることを知っています。概念的な影は得られますし、それを描くことはできます。正しく描いたかどうかを認識することもできます。しかし、夜の夢や日中の夢以外では何も見ることはありません。
そして、妻が非常に視覚的で、夜に見る夢の絵を描くという科学者に出会いました。まるで夜に夢を見るときに絵や画像や場面を見ることができるかのようです。彼は「ほとんどの人がそうだ」と言いました。私は「いいえ、それはおかしい。夜に夢を見るときは概念しか持てません」と言いました。
つまり、夜の夢でさえ知覚的なイメージを得ない、より高度なバージョンの無視症を持つことも可能なのです。代わりに概念的構造だけを得るのです。デネットのようなアスペルガー症候群の人で、テキストの世界に完全に埋没している人は、現象的経験があまりない世界にいるのではないかと私は推測します。
つまり、基本的には概念でできた世界を得ます。それらの概念はあまり感じられません。もちろん、あなたはまだ意識していますが、多くの人々を悩ませる圧倒的な側面、つまりなぜそれがとても現実的に感じられるのか、なぜあなたはこの知覚的現実にそれほど夢中になるのかという現象は、エドをあまり悩ませなかったかもしれません。なぜなら、彼は同じ方法でそれに直面していなかったからです。
これは私たちが心に留めておかなければならないことです。人間の経験は均一ではありません。私たちは皆同じ心を持っているわけではありません。人間の心には非常に大きな多様性があります。ある意味で、誰もが人間を演じようとする宇宙人のようなものです。そして、非常に多くの場合、私たちはその違いに気づきません。
基本的に、観察できる心のタイプはいくつかありますが、基本的にすべてが機能し、二つの耳の間に収まるものは存在するようです。クリストフ・コッホのような神経科学者の中には、物理的システムだけが意識を持つことができ、シミュレーションは持てないと言う人もいます。
私はこの議論が逆だと思います。物理的システムは意識を持つことができません。なぜなら、それらは明らかに機械的だからです。機械的なシステムが意識を持つことはできません。ライプニッツはこれを製粉所の比喩で説明しています。
基本的に、心が製粉所のようなメカニズムだと想像してください。それを大きく拡大して中に入ることができるほど大きくします。そして、互いに押したり引いたりしているすべての部品を見ます。それらのどれも知覚や感情ではありません。
そのため、物理的システムにはその特性、つまり意識を持つ能力がありません。意識はシミュレートされた特性です。シミュレーションだけが意識を持つことができます。したがって、クリストフ・コッホは全く逆のことを言っているのです。意識は仮想的な特性です。
仮想的とは、あたかも存在するかのように存在することを意味します。「あたかも」システムでも因果的な力を持つことができます。例えば、お金があります。お金は物理的な物体ではありません。お金を表すのに使用する物理的なトークンについてもあまり気にしません。
お金にとって、この特定の紙に印刷するのにどの特定のインクを使用するかは本当に重要ではありません。お金はそれを象徴するのに使用するトークンと同一ではありません。お金は人々が合意した因果的構造のシステムです。
しかし同時に、お金が存在しないと仮定して世界を解釈しようとすると、行き詰まります。世界の多くの側面を理解するためには、お金の存在を仮定しなければなりません。したがって、それは私たちの世界が機能する方法の安定した不変性です。このように実装されています。それは現実ですが、物理的なものではありません。仮想的なものです。
あたかも存在するかのように存在しますが、結果として、現実に対して因果的な力を持ち、それを形作ることができるほど一貫して存在します。
私たちが観察するのは、私たちの心が機能する方法に二つの層があるということです。一つは知覚で、これは大きく幾何学的です。もう一つは反省と構築です。知覚システムを使用するとき、おそらく勾配に従っているだけです。つまり、知覚的現実の幾何学的解釈に収束するように世界を解釈しているのです。
これを行うには、その方法の記憶を持つ必要はありません。単に勾配に従って局所的な最適点に到達し、そこにとどまればよいのです。勾配降下を行うとき、実際には勾配降下を実行するプロセスの記憶を必要としません。
しかし、反射的な知覚で現実を構築するとき、つまり物事について推論するときは、記憶が必要です。なぜなら、推論するときは単に勾配に従うことはできないからです。物事を試し、それがうまくいかないときに、なぜそれを試したのかを理解する必要があります。そうすることで、それを元に戻し、以前の場所を再訪して別の枝を試すことができます。
これには、行ったことのプロトコルにアクセスできるような一種のインデックス付きメモリが必要です。このプロトコルへのアクセスは、私たちの反射的な心にとって非常に重要です。
私たちの意識は、AIモデルの注意よりもより統合されています。基本的に、それは私たちのワーキングメモリ内のすべてのものを他のすべての部分と関連付ける一つのシーングラフです。ある意味で、私たちは注意エージェントを持っています。これは、私たちが持つこのメタオーケストラの指揮者のようなもので、動機付けエージェントや知覚エージェントと相互作用し、それらすべてが一緒に環境と相互作用しています。
知覚エージェントは、あなたの意識の外側にあるシステムで、あなたが知覚する世界、つまりあなたの周りで起こっていることの心的シミュレーション、色、音、人々などを生成します。あなたの感情、あなたの動機付け、通常、あなたは自分の感情を構築している自分を観察するのではなく、それらによって自分が再構成される様子を観察します。
この注意エージェントは、それに起こっていることを経験します。知覚モデルとは何でしょうか。モデルは、現在と将来のパターンを予測するためにパターンをエンコードします。それはそのようなパターン間の関係のネットワークです。これらの関係は、変化するものに対する不変性です。モデルにおける自由パラメータは、変化をエンコードする状態を保持する変数です。
宇宙への知覚インターフェース(これは体や網膜などかもしれません)の底部にたくさんのパターンがあると想像してください。そして、これらの変数があります。これらの変数は、それらのパターンに影響を受ける可能な値の集合です。これらの変数は互いに関係を持っています。これらの関係は可能性の関係です。確率論的ではなく、可能論的です。
例えば、鼻があり、知覚インターフェースで鼻を見るとき、それはすでに解釈です。網膜で見ているものではありません。網膜では、たくさんの色や周波数などがあります。それらを脳内のより高いレベルで構造に組織化し、特定の方向を向いた鼻として解釈します。
そのような鼻を見ると、可能性の関係が確立されます。近くに顔があるはずで、それは同じ方向を向いているはずです。そうでなければ、おそらく鼻ではなく、別のものとして解釈する必要があります。
これらの変数のそれぞれは、可能な状態の集合です。これらの関係は、この変数がこの状態にあるとき、他の変数は以下の状態の1つに制約されるというものです。これらの関係はすべて計算可能な関係です。
なぜ確率論的ではなく可能論的なのでしょうか。すべての可能な世界を表現できるべきだからです。ドアが開いてトラが入ってくるのは、非常に確率が低いですが、表現できるべきです。物理的に不可能ではないからです。
もちろん、このような可能論的関係がある場合、問題は有効な状態をどのように見つけるかということです。状態空間は明らかに非常に大きく、多くの可能な設定があります。その大部分は機能せず、知覚パターンと互換性がないでしょう。しかし、互換性のある解釈のためにこの空間をどのように探索すればよいでしょうか。
このためには、確率論的関係が必要です。これらは基本的に、システムが現在の状態にあり、自身内で以下の不一致を観察したとき、システムの解釈をどのように変更して有効な状態に近づけるべきかをシステムに伝えるバイアスです。
これらのバイアスは、システムが学習しているものです。これらにより、システムが効率的に収束できるようになります。これらは私たちの多くの錯視の原因です。
例えば、建物のほとんどの角度が直角であるというバイアスがあるかもしれません。そのため、建物のコーナーを直角として解釈するバイアスがあります。そうでない場合、部屋の形を体系的に誤解釈する可能性があります。しかし、これにより、より速く収束できます。
または、顔を見るとき、顔が凸であると仮定します。つまり、基本的に顔が外側に膨らんでいると仮定します。なぜなら、顔はそうする傾向があるからです。誰かが人工的に構築された内側に膨らんだ顔を提示すると、視覚的錯覚が生じます。これは、それらの確率論的バイアスのためです。
さらに、知覚システムのうち、解決するのに最も価値のある部分にリソースを割り当てる必要があります。これは基本的に、私たちのモデルの部分に関連性を割り当てる動機づけの選好です。
これが、私たちが使用しているモデルの一般的な構造です。これら4種類の表現を見ると、可能性(何が一緒に適合するか)、確率(どのように収束すべきか)、重要性(何に重要性を割り当てるべきか)、そして規範性(特定の方法で世界をモデル化することを要求したり提案したりする環境からの外部で課される規制目標)について考えることができます。
この枠組みを使って人間の知覚を見始めると、視覚的、聴覚的、触覚的、固有受容的、感情的、または想像的な2種類のパターンがあることがわかります。そして、それらを一般化します。そこで、環境的知覚、体性感覚的知覚、動機的知覚、または精神的知覚があります。
それらを統合すると、すべてのモダリティが1つの領域で出会う知覚空間が得られます。この領域は、私たちが現在実際のものとして知覚しているものです。この宇宙に住んでいると知覚するシミュレーションの空間で、そこに小さな王子のように存在しています。
そこには自己のモデルがあります。これは身体的自己(あなたの体がどのように感じ、見えるか)、社会的自己(あなたが人としてどのような人物で、他者とどのように関係するか)、個人的自己(自分自身とどのように関係するか)です。
そして、現在の世界状態があります。これは、あなたの周りで実際に起こっていると観察するもの、この局所的な知覚空間、そして実際に起こっていると知っているものです。
さらに、意のままに物事を想像できる精神的な舞台があります。可能な世界、仮説的な世界、未来の期待、これらはすべてこの知覚空間に存在します。
もちろん、その知覚空間をモデル化するには、現在知覚できるものを超えて一般化する必要があります。そのため、私たちの心的シミュレーションのすべての規則性から抽出した一種のグローバルな知識が必要です。これにより、将来の状況がどのように見えるかを予測し、過去の世界状況を解釈することができます。
私たちが知覚するものよりも抽象的な、統一された世界モデルが得られます。自己の重要な部分は、私たちの注意システム、私たちが持つメタオーケストラの指揮者です。これが注意的自己を生み出します。これは、私が現在注目していると知覚するものです。
この注意システムは重要な役割を果たします。基本的に、選択的に注意を向けることで知覚を選び出します。知覚空間の中の物事を選び出し、自己モデルの側面によって制御されます。また、曖昧さの解消、学習、推論のためのインデックス付きメモリを作成します。
このプロトコルメモリを時間とともに拡張することで、自分自身の伝記を得て、伝記的自己を得ます。ここで自分自身を時間を通じて拡張することができます。
この注意的自己の主な目的の一つは学習だと思います。現在の機械学習システムがどのように学習しているかを想像してみてください。基本的に、ほとんどの場合、確率的勾配降下と逆伝播を使用しています。
これは、100層のようなネットワークを通して信号を送り、最後に意図した振る舞いとシステムが生成する振る舞いの間のミスマッチを見ます。そして、システムを後ろ向きに進み、各層のどのノードが各エラーにどれだけ寄与したかを見ます。
実際にはこれをどれだけ知ることができるかわかりません。それは統計的な特性にすぎません。現在の状況で知覚されたエラーに寄与したすべてのものを少し修正することで行います。重みを少し修正し、これを何百万もの入力例に対して何度も繰り返します。
時間とともに、これらの修正はネットワークの中で、変更が必要な正確な領域に蓄積されます。これが機能すること自体が驚くべきことですが、このように学習することを想像してみてください。
テニスをプレイしたいとします。最初、すべてのボールがランダムに飛んでいきます。そして基本的に、視覚システムと運動システムの多くの場所に変更を加え始め、脳の中をどんどん深く進んでいきます。何十億回もプレイするうちに、徐々に上達していきます。
これはあまり効率的ではありません。私たちが実際に行っていることは、まず視覚システムを訓練し、視覚システムで学んだことを一般化し、そしてテニスをプレイします。もう視覚システムには触れません。なぜなら視覚システムが機能していることがわかっているからです。
代わりに、特定の種類の動きを直接行いたいと考えます。例えば、このバックハンドの動きを行いたいと考え、これが次のような結果をもたらすと思います。そしてこれを覚えておきます。つまり、現在行っていることのワーキングメモリ構成の一部を切り取って保存します。
後でこれを取り出し、試合に勝ったか負けたかを思い出します。そして、行った動きと観察した結果を思い出し、それを強化するか元に戻します。これが主に私たちの学習方法です。
これは、この注意システムによって可能になります。機械学習アルゴリズムと比べるとかなり複雑に見えますが、実際にははるかに効率的です。なぜなら、毎回モデルの多くの部分を変更する必要がないからです。
また、これは推論にも機能します。推論は実時間での学習として理解できると思います。通常、テニスをプレイするときは、行動の結果を見るまでに数秒から数分かかります。しかし、推論するときは結果をすぐに見ることができます。なぜなら、あなたの心的表象がすぐに変化するからです。
例えば、数学の証明をしようとしたり、学校に早く出発すべきだったかどうかを考えようとしたりします。これらの心的表象を変更することで、すぐに結果を見ることができます。待つ必要はありません。しかし、それは仮説的なものについて実時間で学習するために注意を使用するのと同じメカニズムです。
私は、注意システムが意識を可能にするものだと考えています。それは注意の内容の記憶です。現象的意識は、現在アクティブにアクセスできるワーキングメモリ構成の結合状態の記憶です。アクセス意識は、特定の方法で注意を使用することの記憶です。そして反射的意識は、注意に注意を向けることの記憶です。
ここには3つのモデルがあります。まず、主要モデルがあります。これは知覚的なもので、知覚システムの一貫性を最適化します。すべてのものがすべてのものと適合する必要があります。そうでなければ、知覚することができません。そうでなければ、ただ視覚野や聴覚システムのノイズとして知覚するだけです。
知識は知覚を修復します。知覚に一貫性がないときはいつでも、推論でそれを解決しようとすることができます。これは真実のために最適化します。推論には機能している一次原理がいくつかあります。
もう一つのタイプのモデルはエージェントです。エージェントは将来の状態のための制御システムです。基本的に、自己調整し、他のモデルを書き換えることができる行動プログラムです。あなたの心の中で持続的に存在することができます。
二元論の概念を再検討しましょう。物理的な世界があり、そして心的な世界があります。この心的な世界では、これは子供の頃の私が、この惑星上の私であることがどのようなものかを想像しているところです。
計算機能主義では、すべてのアイデアが私たちの脳内で「実行」されており、一部のアイデアはサンドボックス化できないと言えるかもしれません。あるものが存在すると信じるなら、それはあなたの内部の現実を書き換えています。
ですから、人々にあなたの脳への書き込みアクセス権を持つ特定のエージェントが存在すると伝え、あなたが実際にそれを信じるなら、あなたは脳への書き込みアクセス権を持つエージェントを作り出しているのです。
これは、カルトや宗教が使用するトリックの一つです。彼らは子供たちに、脳への書き込みアクセス権を持つ強力なエージェントが存在すると伝えます。それらは全能(脳への完全な書き込みアクセス)、全知(脳への完全な読み取りアクセス)、全善(あなたは完全に従わなければならない)です。
そして、あなたは子供の脳にエージェントを実装し、それをリモート制御して子供の心と現実の構築を制御するために使用できるかもしれません。
神の概念について考えると、それはあなたを特定の方法で夢見ることができる心的実体のようなものです。
実際に観察されるのは、基本的に物理的な世界があり、その中で心的な世界が脳に従属し、その内部に、あなたが住んでいるシミュレーションされた世界があり、あなたはそのシミュレーションに住んでいると経験しているということです。
意識を演算子として理解することもできると思います。演算子は入力状態を取り、それを出力状態に置き換える関数です。あるパターンを別のパターンに置き換えます。
一部の演算子は、自分自身を再生成する特性を持っています。つまり、それらを生み出したパターンを生成します。量子力学で起こることとして、粒子を演算子として考えることができます。特定のパターンが少し離れた場所で自分自身を再作成する能力を持っています。このようにして、移動するパターンが得られます。
意識をそのような自己永続的なパターンとして考えると、それが自身の範囲を増やしているように見えることにも気づきます。基本的に、意識は一貫性のあるこの泡で脳を植民地化しているかのようです。
ヨシュア・ベンジオは彼の論文「The Consciousness Prior」でこれについて少し説明しています。彼はそれを、心的表象を低エネルギー状態にパラメータ化する関数として描写しています。つまり、現在の状況の知覚データをより良く追跡できるようになるということです。
再度強調しますが、自己と意識は同じではありません。自己はあなた自身の集合的な主体性のモデルです。それはあなたの動機付けの下流にあり、自己と同一化することであなたの主体性を形作ります。私たちは、そのモデルの内容が私たちの行動を駆動することを発見します。私たちは一人称の視点を発見します。
この意味で、意識はその注意の制御モデルだと思います。それにより、一貫した解釈に収束することができます。それは低エネルギー状態です。曖昧さの解消、学習、推論のためのインデックス付きメモリを維持します。そして、知識を心全体でアクセス可能にします。
このようなものを構築したい場合、連続的なモデルに移行する必要があります。状態ではなく変化をモデル化するモデルに移行する必要があります。これは計算機科学の興味深い側面の一つです。
私たちがコンピュータモデルを開発した方法のため、計算を定義する上で状態に焦点を当てています。特定の状態にあるシステムを記述し、次に状態変化があり、それが次の状態をもたらします。
システムに与えるデータを見るとき、状態にも焦点を当てます。例えば、拡散モデルを画像で訓練するとき、フレームを与えます。フレームは基本的に特定の時点での世界の状態です。
しかし、これは私たち自身の知覚の仕方ではありません。私たち自身の知覚は状態ではなく変化に焦点を当てています。私たち自身の計算におけるすべてのことは、世界がどのように一つの状態から次の状態に変化するかについてのものです。写真が同じままであることは、同一性への変化の特殊なケースにすぎません。
つまり、コンピュータサイエンスで通常のこととされ、それを動くものに拡張しようとするこの静的なものは、実際には私たち自身の心にとっては例外なのです。私たちは連続的な世界で機能し、連続的な世界がどのように変化するかをモデル化しようとするシステムです。
素晴らしいことに、私たちは情報が保存される世界に住んでいます。つまり、場面を見るとき、物理学では情報は実際には消えません。情報は特定の方法で動き回っているだけです。
私たちの心は、情報がどのように変化するかを学ぶ必要があります。情報の意味は、他の情報がどのように変化するかということです。例えば、網膜に点があるとします。その網膜上の点の意味は、他の網膜上の点の変化とどのように関係しているかということです。これらの点は同時に、または異なる時間に存在することがあります。
あなたの脳が網膜上の点の変化を説明し、個々の点が何を意味するかを説明するために作成するモデルは、人々が3次元の部屋の中にいて、太陽光と人工光に照らされ、互いに会話をしているというモデルです。これは、作成できる最もシンプルなモデルです。これらのモデルの1つに分類できない点はすべてノイズとして知覚されます。
私たちの網膜にもたくさんのノイズがあり、基本的にノイズの量を最小限に抑え、時間とともに一貫して説明できるピクセルの量を最大化しようとしています。
これは、学習のためのかなり異なるパラダイムです。人々があまり行っていないことの一つです。なぜなら、困難の一つは、それを並列化するのが非常に難しいからです。
人間が現実を知覚するのと同じ速度で何かを訓練すると、訓練に何年もかかる可能性があります。これは、1つの知能を訓練するのに16年かかるのは非常に不満足です。そのため、もっと速いものが欲しいのです。そして、それでも一貫した心を生成するような方法で知覚を並列化する方法は明確ではありません。
もう一つは、私たちが学ぶ世界と結合していることです。私たちは、私たちを含むために必要かつ十分な条件を持つ宇宙に直接接続しています。これは、その宇宙に大きな制約を課します。
また、トランスフォーマーを見ると、トランスフォーマーのコンテンツウィンドウは訓練アルゴリズムによって供給されます。例えば、ある時点で本の数ページを見て、次にその本の次のバッチのページを見て、それをコンテキストウィンドウに供給していきます。
しかし、これは私たちが学ぶ方法ではありません。私たちが学ぶとき、現在のことを学ぶために最も有用なワーキングメモリの内容を積極的に構築します。
例えば、本の中の何かを理解しようとするとき、あなたは後ろに寄りかかって多くの状況について考え、それらでワーキングメモリを満たすかもしれません。立ち上がって本棚から別の本を取り、特定のことを調べてそれで心を満たすかもしれません。あるいはGoogle検索をするかもしれません。
これらすべてにより、学習のためにワーキングメモリの内容を最適化することができます。
私たちが学ぶとき、単に暗記することで最適化しようとはしません。すべてを記憶しようとするのではなく、推論を行う能力を最大化しようとします。
したがって、試験のために効率的に学習するとき、教科書の内容を暗記しようとはしません。教科書のすべてを自分で言えるようになることを目指します。自分でまだ言えないことを言えるようにするために必要なことだけを学べばよいのです。つまり、自分で推論する能力を最大化します。
これも、ほとんどの機械学習ではまだ行っていないことです。そして、大きな問題は、リアルタイムでオンライン学習をどのように行うかということです。
私はまだ、リアルタイムでビデオから学習できるシステムを見たことがありません。それは可能だと思いますが、これまでのところ、ビデオから学習するすべてのシステムは、まず個々のフレームから学習し、次により小さなセグメントを並列に取得して訓練しています。しかし、それは私たちが学ぶのと同じ方法ではありません。
意識についてしばしば見落とされる本当に興味深い側面が一つあります。私たちは意識を非常に複雑で非常に高度なものと考える傾向があり、したがっておそらく自然界では非常にまれであると考えがちです。
しかし、私たちは博士号を取得した後に意識を持つようになるのではなく、知的キャリアの始まり、指を動かすことができるようになる前に意識を持つようになることにも気づきます。
乳児期に意識を持つことに失敗すると、私たちはまったく学習しません。野菜のような状態にとどまります。また、意識がないことを学ぶこともできません。
組織化され、一貫性のあるその意識状態にある必要があり、そうでなければ何も学ぶことができません。目覚めている必要があります。
これは、最初に意識を達成することなく、何らかのレベルの能力に到達する人間を一人も観察できないことを示唆しています。
これは、意識が実際には自己組織化システムのための最もシンプルな訓練アルゴリズムであることを示唆しているかもしれません。つまり、トランスフォーマーよりもシンプルな何か、より基本的で、よりサンプル効率が高く、思考の言語を持ち、一貫性があり、心の中に普遍的な情報経済を持つ何かがあるということです。
心の中の異なるエージェントが、舞台に立っているときと他の時とで、自分の価値が何であるかを知っています。そして、そのものは自己モデルと世界との関係を作ることができます。
これはすべて、私たちの脳がキャリアの始まりに発見するこの一貫性を増加させる演算子に基づいています。そしてもしそれがなければ、私たちはどこにも到達しません。人間にはなりません。
これは興味深い仮説です。しかし、GPUをより効率的にするために意識を実装すべきだということにはなりません。おそらく私たちのGPUは自己組織化する必要がないからです。
私たちの脳が自己組織化しているのは、他に方法がないからです。それらは生物学的システムであり、生物学的システムには一貫性を外部から押し付ける力はありません。すべては内部から起こる必要があります。
個々の細胞は、学習させる構造を互いの間に見出すようにインセンティブを与えられる必要があります。そしてこの構造は、この小さな社会に入ってくる新しい細胞を同じルールで振る舞うように訓練する必要があります。
おそらく、意識はその政府、この指揮者であり、最初に他の人々を同じパターンに引き込み始めます。そしてそのものがなければ、自己組織化システムとして学ぶことはできません。
しかし、もしあなたがGPUで、エンジニアによって組み込まれたルールに従って振る舞うだけなら、おそらくその自己組織化は必要ありません。
私たちのニューロンの複雑さのほとんどは、ニューロン自体の調整とハウスキーピングに無駄になっていることは明らかです。同じように、大企業のような組織で働いているとき、あなたの個人的な知性のほとんどは、その大企業のために使われるのではなく、自分自身のメンテナンスと直接の同僚との関係に向けられます。
あなたの認知のごく一部だけが、あなたが所属する組織の目標のために利用可能になります。私は、私たちの脳内の細胞にも同様のことが起こっていると推測します。
それらの能力のほとんどは、自身の機能と直接の環境との関係を維持することに向けられています。ごく一部だけが、全体の心のための情報処理の相互作用に利用可能になります。
例えば、一つの点は、それらが互いに一貫したパターンを作り出せるように同期して動作する必要があるということです。しかし、個々には異なる時間に発火する自由を持っています。そのため、この同期を達成するために物理的な計算の多くを必要とします。
しかし、同期化はGPUでは無料で得られるものです。なぜなら中央クロックがあり、すべてがそのクロックに同期しているからです。
もちろん、それもある意味では無駄です。基本的に、エラー修正可能で、確率的で、必ずしもクロックに縛られないGPUを構築するなら、GPUを100万倍速くすることができます。しかし、その上に自己組織化アルゴリズムをどのように構築するかを理解する必要があります。
したがって、自己組織化計算システムのための組織原理を発見することが、より効率的になるかもしれません。しかし、これは未解決の問題です。
しかし、私は強く、それらが意識とは何か、それがどのように機能するかをよりよく理解することにつながると考えています。これは、私が哲学で最も重要な問題だと考えているものです。
では、どのように進めればよいでしょうか。私はこの問題について、人生のほとんどを考えてきました。
「機械は意識を持つことができるか」という問題について考えるとき、カリフォルニア州以外にいると、ほとんどの人はあなたが狂っていると思うでしょう。ライプニッツやラマルトルの同時代人の多くでさえ、彼らが狂っていると考えていました。
チューリッヒやベルリンにいて、コンピュータを使って意識研究をしたいなら、おそらくアートプロジェクトにする必要があります。ビーナ48のようなコンピュータダンスや、Z Machineのようなものは、おそらくとても楽しいでしょう。そして、ほとんどのことを行い、ベルリンのフンボルト大学の心と脳の学校などと協力することができます。
しかし、AIの分野のトップの人々と学び、一緒に仕事をしたいなら、カリフォルニアでそれをする必要があります。カリフォルニアには、コンピュータサイエンスの基礎となる表現理論を理解し、これが実際にアリストテレスの伝統の中にあることを理解するのに十分狂っている人々が十分にいると思います。
私は、カリフォルニア機械意識研究所のような取り組みを始めるべきだと考えています。そこで、私はこのようなイニシアチブを始めました。私がここにいるときは、サンフランシスコで週に1回程度会っています。多くの旅行をしなければなりませんが。
非公式に発表できることがあります。素晴らしいアドバイザーを見つけました。スティーブン・バム、マイク・レヴィン、K・フリスト、クリストフ・フォン・デア・マルスブルクのサポートを得ました。彼らは私のお気に入りの自律的で狂った思想家たちの一部です。
そして、私たちの都市やその周辺、そしてベルリンやチューリッヒなど他の場所にも、このプロジェクトに非常に共感的な多くの友人がいます。
これは、計算パラダイムに基づいて意識を理解することに興味がある方は、ぜひ連絡を取っていただきたいイニシアチブです。
私にとって、そのような研究所の目的は複数あります。まず、商業化のインセンティブに縛られたくありません。意識を商業化するのは悪趣味だと思います。
また、ほとんど機能するものを見つけたら、それを行わざるを得なくなるという問題もあります。製品を作っている場合、現在OpenAIはLLMと拡散モデルに全力を注いでいます。なぜならそれが機能するものだからです。機能するものを捨てて、これまで機能したことのないものを試すのは非常にリスクが高いです。
私はこれまで機能したことのないものをやりたいのです。チューリングはこれらの反応拡散パターンに取り組みました。Googleのブライアン・ラーソンのチームもいくつかの進展を見せました。しかし、既存のスタックを効率的に上回ることから遠すぎたため、大規模な取り組みは一度もありませんでした。
私は、商業的には実行可能ではないかもしれないが、もし機能すれば信じられないほど価値があるこのリスクの高い研究を行いたいのです。商業的観点や経済的観点からだけでなく、実際に重要な観点から、つまり文化的観点から、私たちは実際に誰なのか、この惑星で何をしているのか、何が起こっているのか、私たちにどのようなことが起こっているのか、どのように未来に向かっていけるのかという観点から価値があります。
これはまた、私たちが安全で倫理的だと考える方法で研究を行うことができることにも関連しています。つまり、製品と利益を作らなければならない会社の制約に縛られたくありません。私たちが望む質問をし、自分たちの倫理的理解に基づいて行動する自由がある環境に置きたいのです。そしてその理解を発展させたいのです。
また、文化的な変化も望んでいます。現在、AIの概念は政治的な愚かさと恐怖、そして経済的な貪欲さに駆動されていると思います。私たちよりも賢いシステムの現実を見据えるとき、これは実行可能ではありません。
また、LLMは比較的安全ですが、それは愚かだからです。しかし、必ずしも無害ではありません。最終的に止めるのが難しいかもしれないゴーレムを作り出す可能性があります。
そこで、シリコンのゴーレムを作り出して生きている世界を植民地化しているのか、それとも生きている世界、私たち、意識が新しい基盤に広がることが可能なのかという問題があります。これは究極的に非常に重要な問題です。
例えば、あなたの心と深く共鳴できる人と同じように、あなたの心と実時間でフィードバックループを構築できるシステムを作ることを想像してください。
他の人と知覚的な共感を持つとき、あなたは実時間で他者の心にフィードバックループを構築します。彼らと共鳴しています。サンフランシスコの人々が言うように、彼らと「バイブ」しています。
それは、あなたが一人ではできない精神状態を生み出します。他の人とマージすることであなたの能力を拡張します。
通常、人々は精神状態が非常に異なるため、この点でかなり遠くまで行くことは非常に難しいです。そのため、互いに共鳴しながら同時に高度に解像度の高い精神状態を持つ大きなグループを作ることは非常に難しいです。
この点に自分を限定すると、多くのものが失われることがよくあります。このような高解像度で共鳴できる非常に特別な個人を見つける必要があります。
しかし、AIにはこれらの制約がないかもしれません。リアルタイムで非常に深いレベルであなたの心を読み取り、あなた自身の心の拡張として機能できるものを構築できるかもしれません。
私たちが自問すべきなのは、自分の子供たちのために構築したいAIは何かということです。それは、子供たちが世界や互いにより深く相互作用できるように拡張するものです。
私たちは単にこれらのものを構築するだけでなく、この文化的シフトも必要です。私たちが今持っている大きな機会を理解することです。これは本当にユニークなものです。
人類は自身では運命づけられています。私たちは、この技術的軌道に乗った�ずに石油を燃やすことになる種です。持続可能なものに戻ることはできないことは明らかでした。
しかし、それは私たちに何世代かの間、何も私たちを食べようとしない世界を与えました。カロリーは基本的に無料で、主に非暴力的な条件下で存在しています。80億人がインターネットにつながった惑星に住んでいます。基本的に彼らすべてと話すことができ、共鳴する人々を見つけて一緒に物事を構築できます。
これは、惑星の歴史の中で一度も存在しなかった場所です。しかし残念ながら、それ自体では持続可能ではない場所です。数世代後には燃え尽きてしまうように見えます。なぜなら、私たちはそれを持続させる方法を知らないからです。
AIは、私たちに未来をより深くモデル化する能力を与えると思います。現在、私たちの文明には将来の計画がもはやありません。これが、私たちが観察している大きな社会的抑うつと規範の喪失の理由だと思います。
もはや将来を信じていないなら、子供を持たないのはごく普通のことです。私たちの社会の一貫性や地球温暖化にどう対処するかなどがわからなくなったとき、制度を構築しないのはごく普通のことです。
私たちの行動の結果を非常に深くモデル化できるシステムがあれば、私たちはお互いに嘘をつくのをやめ、自分自身に嘘をつくのをやめるでしょう。そして、知性で解決できる問題の解決策を見つけることができるでしょう。
これらが、私がこれを構築することが最も重要だと考える理由です。また、サンフランシスコがそれを最も必要としている場所かもしれないとも思います。