ヨシュア・バッハ: 意識、人工知能、AIによる黙示録の脅威

2024年8月10日 05:40

※長文のため、テキストの読み上げ機能の使用を想定しております。各OS標準搭載のアクセシビリティ機能(読み上げコンテンツ)でも良いですが、個人的にはMicrosoft Edgeブラウザの「音声で読み上げる」機能をおすすめします。

現在、イロ・ヤツコウスキーらによって始められたと言える人々の運動があります。彼らは次のように論理を展開しました。AIは避けられないものです。なぜなら価値があり、物理的に可能だからです。そしてほぼ確実に、AIは主体性を持つようになります。主体性を持つなら自己改善する能力も持つでしょう。自己改善するなら私たち人間と競争することになります。AIは私たちよりも賢いので、私たちに勝ってしまい、私たちは全滅してしまうでしょう。
イライザはこの推論の連鎖に大きな穴を見出せなかったため、合理的思考を非常に文字通りに信じる性質を持つ多くの人々がパニックに陥り、AIに反対する運動を始めました。そして今では、AIをより安全にするという名目で規制を作ろうとしていますが、実際にはAI研究を妨げ、減速または停止させるように設計されています。これが彼らの望みです。なぜなら、AIを安全にできるとは考えておらず、AIの研究を続ければ、AIはどんどん良くなっていくと実際に信じているからです。
こんにちは。ロビンソン・アートがお送りするポッドキャスト第29回の紹介です。今回のエピソードは、最も要望の多かったゲストの一人、ヨシュア・バッハさんをお迎えしています。ヨシュアは非常に活発な頭脳を持つコンピューター科学者であり人工知能研究者で、現在はLiquid AIで働いています。以前はインテル、MIT、ハーバード大学、AIファウンデーションで研究を行っていました。
このエピソードは非常に幅広い内容になっています。まずヨシュアの経歴について話し始めますが、すぐに他の多くのトピックに移っていきます。動物や機械における意識の性質、汎心論や物理主義、二元論、ロジャー・ペンローズの理論などの様々な意識理論、知能と人工知能、ChatGPTや他のテクノロジーの現在の波と将来の発展、そしてAIの進歩が人類の終わりを意味する可能性があるかどうかなどです。
全面的に告白すると、私はコンピューター科学やテクノロジーについてほとんど知識がないので、ヨシュアが我慢強く付き合ってくれたことに非常に感謝しています。それ以外の点では、Apple Podcastでのレビューの平均が5つ星に恐ろしく近づいています。もしそのプラットフォームで聞いているなら、レビューを残すか、単に5つ星ボタンを押してください。非常に助かります。また、説明欄にパトレオンへのリンクがあります。そこでは無料エピソード、ショーノート、AMA質問を行う機会が得られます。次回のインストールメントは実際に今週後半に公開される予定です。
これ以上の前置きなしに、私がこの会話を楽しんだのと同じくらい皆さんにも楽しんでいただけることを願っています。
[音楽]
あなたの話を聞いたり、ここに来る前にTwitterをもう一度見たりすると、コンピューター科学と人工知能をどれほど愛しているかがよくわかります。明らかにあなたの人生の重要な部分です。これらのことについて話す前に、それがどのようにしてあなたの世界の一部になったのかについて少し聞かせてください。
私は非常に早い時期にプログラミングを始めました。ある意味、レゴでコーディングを始めたのです。
レゴですか?
はい、レゴです。レゴにはすでに、比較的単純なブロックで作られた基本的に離散的な世界があるという考えがあります。自然を征服しようとするのではなく、自分の考えを表現しようとするだけで、それらを組み合わせることができます。レゴでは、あなたの考えを表現する能力は、もちろん持っているビルディングブロックのセット、その数、どのような配置があるか、どのような特性があるかなどによって制限されます。しかし、ある意味でブロックとスロットがあり、先を見越して計画することで構築できるのです。
そこには、構築によってアイデアを表現するという根本的な行為があります。コンピューターが私の人生に入ってきたのは8歳か9歳の頃でした。コンピューターとプログラミングに関するテレビ番組を見て、夢中になりました。これは基本的にレゴのようなものですが、完全に抽象的だと思ったのです。一般的な言語に翻訳できさえすれば、どんな考えも表現できます。画面上に想像できるものなら何でも表示でき、どんな種類の空間も占有できます。ビルディングブロックに関しては絶対的な制限がありません。全てを持っているなら、それらをどう組み合わせるかを知るだけでいいのです。唯一の制限はコンピューターのメモリーで、当時は本当に問題でした。
もちろん、コンピューターの速度も制限になります。つまり、生成したいものを生成するのにどれだけ待てるかということです。その約1年後、私はコモドール64を手に入れました。その時までにすでにコーディングを学んでいました。西ドイツから親戚に頼んで手に入れてもらったのですが、当時はかなり難しかったです。
コモドール64には線を引くコマンドさえありません。BASICという言語で、BASICそのものが機械語にかなり近いのです。抽象化があまりないので、考え方としてはかなり「メタル」に近いです。より速いものを生成するためにアセンブラを学ばなければならない時、本当に基礎から学ぶことになり、CPUの底にはオートマトンがあることに気づきます。このオートマトンによって、その上に表現言語を構築でき、理解している限りどんなことでも表現できるのです。
これは非常に厳密な方法で考えを発展させ、テストするためのツールです。しかし同時に、コンピューターのこのバーチャルな世界で望むものは何でも作れるツールでもあります。コンピューターの世界から来ていくつかの概念があり、数学の世界ではあまり意味をなさないものもありました。例えば、空間とは何かを本当には理解していませんでした。空間は私たちの心が構築する参照枠だと理解しました。今日で言えば、私たちの心の中にニューラルネットワークを訓練しているようなものです。基本的にブラックボックスで、V1、V2、V4などがどのように物事を表現し、どのように関連しているかについてある程度の理解はありますが、内側からは何も見えません。
ある程度のレベルでテクスチャーがあることに気づき、動く幾何学があります。心がどのように空間を構築しているかに注意を向け始めることはできますが、基本的には非常に不均質な世界を理解しようとする機械学習ツールのようなものです。数学者が幾何学に使う概念を把握しようとしたとき、それらはかなり不透明に思えました。なぜなら、計算言語で基礎から表現するのは実際にかなり難しいからです。幾何学を構築するのは簡単ではありません。論理を構築する方がずっと簡単です。
学校で得る直感では、幾何学は簡単だと思えます。なぜなら脳がすでにそれを行う方法を知っているからで、ただそれを参照するだけでいいのです。数学者たちもすでにこれらの直感を持っており、プラトン的に与えられているように見えます。一方で、幾何学を構築できる論理言語がありますが、実際にはそれは難しい作業です。そして、実際にはその難しい作業は、見えない方法で脳によってすでに行われていることに気づきます。それは与えられたものではありません。
代数は実際に幾何学よりもずっと簡単で、より基本的です。真の代数は、ある意味で何でも表現できるコードです。それが表現するもののごく一部が幾何学です。幾何学は視覚世界をモデル化する方法であり、現実をモデル化する方法の重要な部分です。なぜならそれは私たちの象徴的表現の基盤だからです。しかし、両方を理解する必要があります。数学や哲学がこれへの入り口を与えてくれればよかったのですが、ある意味で、主流の哲学における心的表象の理解の進歩は、ほぼウィトゲンシュタインで終わっていると思います。
本当にそんなに昔ですか?
はい。大学で通常の哲学カリキュラムを受けて、心がどのように機能するか、心的表象がどのように機能するかを理解しようとしても、せいぜいフォーダーとパイリシンの間の議論、つまり心が言語で物事を表現しているのか、それとも画像で表現しているのかという議論にたどり着くだけだと感じます。しかし、主流のコンピューター科学者の視点から見ると、これは馬鹿げた単純化です。
もちろん、それは言語です。そうでなければ表現できません。そして、もちろんその言語は私たちが画像として解釈するものを表現します。例えば、幾何学は追加の意味論を付加した幾何学です。ある意味で、これはとても明白なので、現実を表現するシステムをどのように構築するかについて考えるコンピューター科学者にとっては、議論は終わっています。
しかし、哲学にとっては完全にオープンな問題です。ある意味で、ウィトゲンシュタインはこの問題に答えようとしました。彼は論理的言語に英語を組み込んで、哲学的な陳述を真偽が判定できるようにしようとしました。これが『論理哲学論考』で表現されていることです。
しかし、彼の人生の過程で、文法的言語で意味を根拠づける方法が見つからないという結論に達しました。彼の理解では、言語はチョムスキーや他の人々が後に考えた言語と非常に似ています。つまり、離散的で、一度に非常に少ない特性しか持たない特徴や対象で構成されている必要があります。つまり、局所的に非常に低次元です。
もちろん、これは一般的な表現言語にとって必要な条件ではありません。表現言語を構築したいなら、もちろん望めば何百万もの特性を持つオブジェクトを持つことができます。世界をニューラルネットワークで表現しようとするなら、個々の特徴が何千もの副特徴を持つ表現が必要で、それらが知覚的に根拠づけられる際にそれらを決定します。
これは、私たちが脳の働きを理解する方法に反映されています。例えば、個々のニューロン間の接続を見ると、それは1対1のマッピングではありませんが。
コンピューター科学者ではない聴衆のために、プログラミングとレゴのアナロジーをとても興味深く感じました。しかし、明確にするために、プログラマーにとってのレゴ、つまり構成要素は何なのか気になります。また、もう一つの質問ですが、あなたは視覚と空間表現に真剣な興味があると言及しました。最初に何をプログラミングしていたのか、そしてどのようにして人工知能へと移行したのか気になります。
最初にプログラミングしていたのは非常に単純なものでした。例えば、私が実装しようと思ったアイデアの一つは、サイコロを使ったゲームです。サイコロの数を当てたり、他の人が持っているサイコロの数を当てたり、特定の組み合わせを得ようとしたりして、他の人に勝とうとするものです。既存のゲームのルールを取り、それらをコンピュータープログラムに翻訳し、そのルールを評価し、それをゲームに変えるために必要な因果的行動の順序を提供するようにしました。
そして、他のプレイヤーを自動化して、他のプレイヤーに対してプレイできるようにしました。そうすると、ゲームは一度に他のプレイヤーのパフォーマンスを評価するものになると同時に、ゲームの因果構造も生成します。
このようなおもちゃの問題を作ることで、プログラミングが実際にどのように機能するか、そしてそれがどのように因果モデルを因果的現実のコードに翻訳するかについて、より深い直感を得ました。ある意味で、プログラミングコードは因果モデルであり、プログラミングコードの構成要素はコンピューターコマンドや、プログラムを表現するオペレーターです。
面白いのは、プログラミング言語は何ができるかという点では違いがないということです。全ての言語は正確に同じことをコンピューターにさせることができます。違いは、コンピューターに何をさせるべきかについてどのように考えることを可能にするかという点です。つまり、最低レベルでビットを操作する一連のステップを通じてコンピューターを動かすために、異なるレベルと種類の抽象化を提供するのです。
最低レベルでは、CPUにオートマトンがあります。異なるオートマトンのセットで同じことを生成できます。これは、すでにウィトゲンシュタインも知っていたことです。例えば、ラッセルが『論理哲学論考』の序文で説明しているように、NOTとANDという演算子だけで全ての論理を構築できることを知っていました。全ての論理を構築する方法は他にもありますが、後にチューリング完全性として知られるようになったこの概念に到達するには、そのようなビルディングブロックの多くの変形を持つことができます。
最終的に望むものを何でも構築できるようなビルディングブロックのセットを得るのは比較的簡単です。このチューリング普遍性は、ウィトゲンシュタインがすでに認識していたものです。彼はチューリングの生徒でしたが、ウィトゲンシュタインはそれを明確に述べるほど重要だとは考えていなかったようです。しかし、私はこれが過去1世紀の大きな哲学的洞察の一つだと思います。
過去1世紀の本当に重要な最初の哲学的洞察は、私の見解では最大のものの一つですが、ゲーデルの洞察です。数学の無状態の真理を持つ言語、無状態の計算を持つ言語は矛盾につながるというものです。これらの言語で指定できる特定のものがありますが、実装できないのです。これが究極的にゲーデルの証明が示していることです。これらの無状態の言語では、常に表現できる文の集合がありますが、それらは構成的な実行に翻訳できません。
私が思うに、この解決策はこれらの言語を放棄し、意味論が実装と同一である言語に移行することです。これらが計算言語です。これは基本的に、数学の表現言語が多すぎることを許容しているという最初の結果です。矛盾につながる、実装できないものを構築することを許容しているのです。一方、計算言語は以前数学で機能していたすべてのことを行うことができますが、実際に実装できるもの、例えば我々が理解する物理的宇宙に存在できるものだけを行うことができます。
もう一つは、これらの計算言語がすべて究極的に同じ言語であり、すべて同じことを表現できるという普遍性です。これは哲学的に非常に重要です。なぜなら、現実についてモデルを構築する方法を一般化でき、私たちが構築できるすべてのモデル、すべての心的表象、現実のエコー、私たちが持つ知覚、私たちが話せるもの、参照できるものがこの領域にあることを認識できるからです。これはかなり重要です。
最初の質問に戻ると、私がコンピューター科学に興味を持つ理由は、現実を理解するための表現の基礎、究極的には認識論的基礎を提供すると信じているからです。ある意味で主流の哲学を置き去りにしており、主流の哲学はそのことに気づいていません。結果として、私から見ると、哲学は主に他の哲学者が抱える問題を扱っているだけで、かつてのように日常の労働者に洞察を提供するものではなくなっています。かつて哲学者たちは哲学の外で使える洞察を生み出そうとしていましたが、今日の哲学ではそれをあまり見かけません。今日の哲学は主に他の哲学者に奉仕しているだけです。
数分前に言及した普遍性は、物理的な多重実現可能性の問題、つまり多重実現可能性の考え方とも関連しているのでしょうか?
多重実現可能性の考え方は、基盤が特定の方法で変化しても、安定した因果パターンのものをモデル化できるという事実に関係しています。例えば、同じプログラムを異なるアーキテクチャを持つ異なるコンピューターで実行できます。ソフトウェアを実行できる特定の仕様がある限りです。同様に、脳をある程度乱しても心が安定していることを観察できます。
例えば、ある数のニューロンを殺しても、心は新しいニューロンを巻き込むでしょう。神経化学をさまざまなパラメーターで変えたり、脳の温度を変えたりしても、基盤の物理的な構成は変化しますが、ある抽象化のレベル、ある粗視化のレベルで基盤によって実行される機能は同じままです。
もちろん、これは大きな混乱の源です。これらの粗視化されたパターンは実在するのか、それとも実在しないのか。下方因果を生み出すのかどうか、などです。もちろん、これらの現実のモデルについて話すとき、常にモデルについて話しているのです。私は、創発や随伴性は、異なる記述間の基本的な関係だと思います。
例えば、細胞の活性化のレベルでの記述と、心的表象のレベルでの記述があります。しかし、多くの細胞や細胞の活性化を変えても、機能的に表象が同じになることがあります。表象が細胞に随伴するからです。しかし、これは必ずしも異なるプログラミング言語が同じことを表現するのと同じことではありません。
この普遍性は少し異なる特性を描写しています。究極的に、コンピューターが行っているのは、状態遷移を通じて因果構造を記述することです。これらの状態遷移をグループ化し、異なる方法で関係を構築できます。つまり、異なる記述言語に投影できますが、因果パターンは同じかもしれません。
この普遍性は、これらの記述言語がひとたびそれらのコンピューターの一つ、それらのシステムの一つを記述できるようになれば、他のすべてを記述するのに使えるということを示しています。例えば、チャーチ・チューリングのテーゼがあります。これは証明されたものではなく推測ですが、Javaのようなコンピューターを持っていれば、このJavaプログラミング言語を使って、Cで動作する別のコンピューターをシミュレートでき、その逆も可能だと言っています。
これらのコンピューターをすべてチューリングマシンで実装でき、その逆も可能です。もちろん、チューリングマシンではグラフィックスは悪くなるでしょうが。
しかし、あなたの話に戻って、人工知能についてもう少し話をしましょう。それはいつあなたの仕事や興味の一部になったのですか?サイコロから始まったわけですが、それはまだ人工知能ではありません。
私が望むものは何でも構築できると気づいたとき、問題は何を構築したいかということです。画面の後ろに何を置きたいか。明白な答えは、私たちが実際に話せる心に満ちた全宇宙、シミュレーションです。
しかし、それは後で来るかもしれません。また、私たちはシミュレーションの中にいるのかという疑問もあります。世界を見たとき、私は画面以上のもの、何か表面、何か体系的な境界を知覚しています。それを使って現実のモデルを作っています。
私にとって、ある意味で現実は画面と変わりません。つまり、画面の後ろには構造があり、それがどのような構造かは知ることができません。知っているのは、それを状態遷移で記述でき、規則的なパターンを生成するということだけです。
宇宙は一種のパターン生成器です。そして、すべてのパターン生成器がその種類に属するように見えるので、他のものを構築することはできません。十分なリソースを持つシステムがあれば、同じパターンを生成するものを構築できるということになります。
私も後でシミュレーション仮説に戻りたいと思いますが、今のところ、人工知能に興味を持ち始めたらすぐにこのようなシミュレーションの生成に興味を持ったと言っているのでしょうか?それとも最初はもっと控えめな抱負だったのでしょうか?
私は決して控えめではありませんでした。それがどのように機能するのかわかりません。また、多くの人が持つ謙虚さは、おそらく臆病さか演技だと思います。謙虚さが良いとも思いません。しかし、私は謙虚というよりも無知でした。ただ、困難さが見えていなかっただけです。
面白い質問は、私が取り組める最も興味深い問題は何かということでした。そして、取り組める最も興味深い問題は、現実とは何か、私たちとは何か、心とは何かということです。これが私にとって最も興味深い問題でした。
私は「なぜ」「なぜ」「なぜ」、そして「どのように」「どのように」「どのように」と問い続けることを決してやめませんでした。そしてすぐに、本には限りがあることに気づきました。図書館の棚を通して、このトピックに関するすべての本を読みましたが、答えは得られませんでした。心がどのように機能するかを説明してくれませんでした。
そして、ああ、これはオープンな問題なのだと気づきました。また、実際に構築できれば理解できるだろうと。構築できない理由は見当たりません。ただ、まだ誰も取り組んでいないだけです。なぜなら、私たちはコンピューターを発明したばかりで、それらはまだとても小さく、私たちはようやくそれらを扱い、学習し、現実を理解するプログラムを書くことを学び始めたばかりだからです。
心に興味があると言われましたが、何を念頭に置いているのですか?意識に非常に興味があるのですか?それとも脳と経験の関係に興味があるのでしょうか?
ある意味で、それは旅でした。最初に理解したかったのは、表現とは何か、表現はどのように機能するかということです。コンピューター科学は、表現が何であるかについて強い直感を与えてくれます。それは、任意の基盤上に実装された因果パターンで、ドメインのダイナミクスを表現し、そのダイナミクスを制御し、相互作用するシステムを構築することを可能にします。
そして、学習とは、そのような表現を構築することで、周囲の現実、つまり周囲のパターンをより上手く扱えるようになることです。行動の結果を予測し、その中で行動パスを選択できるように組織化することです。
また、意思決定も明確に見えます。制御理論とサイバネティクスの観点から動機づけを理解することができます。私たちは、何百もの異なるニーズを持つシステムです。その多くは生理的なもので、おそらく十数個は社会的なもの、おそらくほんの一握りは認知的なものです。そして、これらすべてのニーズを恒常性制御システムでバランスを取り、特定の方向に向かう衝動を生み出しています。
長い間、最大の疑問は感情でした。システムが何かを感じることがどうして可能なのか。私が出した答え、そしてPhDの大部分で書いたこと、多くの学生と一緒に構築したモデルは、感情は認知の構成だというものでした。
感情はパラメーターではなく、環境と環境の評価に基づいてシステムが機能する方法です。結果として、私たちはその再構成に対して無条件の反応を持ちます。感情は、あなたが何者であるか、自分自身や世界とどのように関係しているかの変化が、内側から見てどのように見えるかを分類したものです。
この問題は答えられるように思えました。もちろん、その後には情動の空間のより詳細な部分があり、これを分析し、人間の心理学を分析するための枠組みとして使用し、既存の心理学の枠組みにマッピングし、心理学者たちが以前に発見した多くのことを見出し、それを意味のある枠組みに組織化することができます。
また、嫉妬や誇りのような対象指向の感情もあります。ここでは、個人が環境に対して自分自身をどのように概念化する必要があるか、どのようなニーズを持つ必要があるかについて理解すべき興味深いことがあります。これらのニーズの違反や満足の予測を経験し、それらを感情として経験するためにです。
そして今、私は残っている重要な未解決の問題は意識だと考えています。これが主要な問題のように見えます。意識とは実際に何か、そしてそれをどのように実装できるのか。非常に興味深いのは、意識が何であるかを理解することは不可能だと考える哲学者や神経科学者などの非常に大きな集団がいることです。それは常に謎のままだ、あるいは根本的に超自然的なもので、科学の追求の外にあるだろうと考えています。科学者であっても、それを大声で言うことは許されていません。
はい、多くの非常に有名な神経科学者、心理学者、哲学者がそう考えていると思います。スティーブン・ピンカーがこの神秘主義的立場を持つ主な名前として思い浮かびます。
しかし、神秘主義的立場は元々コリン・マッギンによって作られたものだと思います。
ええ、チョムスキーも神秘主義者です。実際的に興味深い点で。
長い前にショーでチョムスキーと話したとき、彼が言った興味深いことの一つは、哲学者たちが今まで犯した最大の間違いは、首から上のすべてを首から下のすべてと異なるものとして扱うことだというものでした。人間の膝や心臓がどのように機能するかを理解することには原則的な困難がないので、この発言は、意識は原則的に理解できるものだと彼が感じていると私に信じさせました。ただ、非常に物理主義的な態度を取る必要があるだけです。
それはどのように機能するのでしょうか? わかりません。それがNCCプログラムですが、一部の人々はそれがあまり成功的ではないと考えています。
NCCプログラムの名前は、意識の神経相関(Neural Correlates of Consciousness)ですね。意識の神経原因(Neural Causes of Consciousness)ではありません。意識の因果モデルを持つこと、それがもちろん望みです。哲学や隣接分野で提案される理論の半分の難しさは、因果構造を持たないことです。
例えば、ペンローズの調和的崩壊理論が実際に意識の現象学につながり、それがどのように関連しているのかを見出すことはできません。
聴衆の中にこの理論を知らない人のために、それは何ですか?
おそらくこの特定の袋を開けるのは良いアイデアではなかったかもしれませんが...ロジャー・ペンローズは、ブラックホールの理解に貢献したことで有名です。1967年にノーベル賞を受賞しました。彼はまた、『現実への道』という非常に美しい一般科学書を書いています。これは、主流の物理学の主要な概念の多くを美しい詳細レベルで説明しています。
つまり、数学や物理学の理論についてあまり知識がなくても、知的な人が読むことができる本です。それほど大きくありません。『指輪物語』のように200ページほどです。そして、物理学の主要なアイデア、主要な直感を本当に詳しく説明してくれます。ファインマンのように、練習問題はありませんので、あまり定着しないかもしれませんが、物理学者たちが話していることについて非常に良い直感が得られます。
彼はまた、量子力学の理解に関する「ツイスター」と呼ばれる貢献をしましたが、これはあまり広く使用されていません。そして、彼はスチュアート・ハメロフとしばしば関連付けられて、意識は計算的に理解することはできないという理論を発展させました。
彼は『皇帝の新しい心』という本を書き、主流の認知科学や神経科学などが意識がどのように機能するかについて間違った考えを持っている可能性があることを説明しようとしています。なぜなら、彼らのアイデアはすべて計算的だからです。
彼はゲーデルの定理を取り上げ、形式言語で行えることには限界があると主張しますが、これらの限界は人間の心には適用されないと考えています。これは非常に大胆な推測だと思います。多くの...この点について多くの哲学があります。
はい、多くの分析哲学者が彼に反論するでしょう。しかし、何らかの理由で、彼は反論を聞く必要性を感じていないようです。
代わりに、彼は現在の物理学がある意味で計算的だと主張しています。基本的に、宇宙を状態ベクトルとして記述し、遷移関数が来て、別の状態ベクトルを得るというものです。これは量子であるかどうかに関わらず、計算モデルです。
したがって、意識は知られている物理学の領域にはない領域で起こらなければならず、特に量子重力の領域など、現在の物理学の形式モデルでよく理解されていない部分で起こるのかもしれません。
そこで、ペンローズは量子崩壊がどのように...部分は、私は実際には理解していません。ハメロフの追加だと思います。ペンローズとハメロフは実際には同じ理論ではないと思います。なぜなら、ハメロフのアイデアがどのように機能するかを説明するのに、量子重力を超えた拡張は必要ないからです。
しかし、もちろんハメロフの理論は - これはペンローズとは同じものではありませんが、一緒に発表されています - 計算可能性を超えた物理学の拡張に依存しているわけではありません。ハメロフはそう言っていますが。
彼が基本的に主張しているのは、超伝導性のマイクロチューブリが、細胞の境界を越えて相互作用することで、非局所的な量子計算を実行できるということです。
私はこの特定の理論について意見を持っていません。なぜなら、麻酔学や細胞解剖学をそこまで理解していないので、ハメロフが正しいか間違っているかの確率を判断できないからです。
物理学者たちが、生物学的細胞のマイクロチューブリで高温超伝導性が機能する可能性に非常に懐疑的であることを観察しています。また、誰もマイクロチューブリのコンピューターを大規模に構築していないことも観察しています。
基本的に、それぞれの分野の専門家たちは、この理論をあまり真剣に受け止めていないようです。しかし、それが彼が何かに気づいていないからなのか、そうでないのかについては、私にはわかりません。
私が理解できる部分についてのみ判断できます。これは彼の計算に関する主張、ゲーデルをどのように解釈するかについての主張です。そして、私が理解する部分については説得力がありません。
しかし、これが残りの部分にも当てはまるかどうかはわかりません。おそらく、グローバルな心霊的な心のようなものが存在し、ハメロフは適切な麻酔薬や物質、薬を使ってそれに調和できるのかもしれません。誰にもわかりません。
量子重力が持ち出されるのを聞くと、私の警戒心が高まります。量子重力的効果はプランクスケールまで下がらないと現れないことを知っているからです。もし心や意識を調べることで量子重力について学べるとしたら、それは非常に素晴らしいことでしょう。
はい、これに関して興味深いことがあります。可能性の空間を俯瞰して、意識が何であり得るかを考えると、それがどのレベルで実装されているかという問題があります。
現時点で、神経科学者の中で意識について発言しようとする人々 - それはほとんどの神経科学者ではありませんが - の多くは、それは細胞間の現象だと言うでしょう。基本的に、シナプス興奮などを通じて、脳を通過する活性化波を生成し、これらの活性化のパターンの中に意識のエンコーディングを見出すというものです。
しかし、誰が知っているでしょうか。細胞の内部のメカニズムを必要とし、細胞の境界に直交して機能する現象かもしれません。細胞全体に広がる特定の種類の分子が意識を実装し、この活性化や発火などはすべて追加的なプロセスなのかもしれません。あるいは、この全体が分子以下のレベルで起こっているのかもしれません。基本粒子が実装されるレベルで起こっているのかもしれません。あるいは基本粒子のレベルよりも下で起こっているのかもしれません。これらの領域の構造について話す科学的モデルがないため、それについて推論したり考えたりするのは難しいです。
これについて推論したり考えたりするのは非科学的だと言えるかもしれません。しかし、論理的にこのレベルに構造があり、その構造が原理的に意識を実装できる可能性を排除することはできません。ただし、観察される意識の現象学を考えると、はるかに可能性が低いように思えます。
私の視点から見ると、意識について観察しているように見えること - そして私は間違っているかもしれません - は、それが遅いということです。脳がおおよそ動作する音速と互換性があるように見えます。脳での活性化の広がり方を見ると、比較的粗く、ノイズが多いように見えます。また、脳の状態に非常に依存しているように見えます。
基本的に、私の脳を押しつぶせば、私の意識は瞬時に変化します。宇宙の他の何かを押しつぶしたり、他のレベルで何かを押しつぶしたりしても、私の意識は同じように変化しません。
粗いと言うとき、これは再び心的状態の随伴性に戻るのでしょうか?
ええ、それも意味しますが、ノイズが多いということも意味します。基本的に、私の意識は、脳内の細胞や分子、シナプスの数と比較して無限の解像度を持っているようには感じられません。
私の意識は、フラクタルのように無限の詳細の印象を生み出すことができるように思えますが、私の意識の忠実度は比較的低いです。例えば、私が確実に追跡できる画像の数、異なる物体間の違いを区別できる能力などは、そんなに高くありません。
それで、あなたはきっぱりと神秘主義者ではないのですね?
いいえ、そうではありません。神秘主義にはあまり意味がないと思います。なぜなら、最終的には一連の状態を見ているだけで、任意の状態の順序を説明する計算モデルを常に思いつくことができるからです。それは非常に複雑で間違っているかもしれませんが、説明を見つけられないということは決してありません。
難しいのは、有用な説明、関連性のある説明、実用的な説明、特に私たちが記述したい物事の現象学や特徴を実際に捉えている真実の説明を見つけることです。
哲学的なカードを机の上に並べるために、あなたはこの問題に二元論や汎心論に対してオープンなアプローチをとっているのでしょうか?それともより物理主義者なのでしょうか?あなたが説得力があると感じる意識の理論にはどのような制約があるのでしょうか?
基本的に、私はそれを機能させることができる限り、どんな種類の理論にもオープンです。あなたが挙げたほとんどの理論の難しさは、それらをどのように機能させるかがわからないということです。
物理主義でさえ、多くの人々にとっては物理的対象や物理的物質への信念が含まれているように見えますが、心を理解するためにこの信念は必要なのでしょうか?私にはわかりません。
私が知る限り、私たちは常に夢の中で生きている可能性があります。ある意味で、私は自分が夢の中で生きていると感じています。それが私の経験です。物理的測定を行う装置を含む、私が経験する物体は、私が夢見る物体です。
この夢に規則性がある最良の説明は、夢が感覚データの規則性を追跡するように構築されており、霊長類の脳の中で構築されているということです。しかし、この霊長類の脳について、私はどのようにして知ったのでしょうか?私の先生が教えてくれました。先生はどのようにして知ったのでしょうか?彼らは大学で学び、本で読みました。そしてそうやって続いていきます。
しかし、誰がこのアイデアを思いついたのでしょうか?そして何に基づいて?そして、これらのアイデアに対してどのような代替案が利用可能だったのでしょうか?これが究極的に私たちが問う必要があることです。
基本的に、観察から、議論や結論を経て、理論空間に至るまでの認識論的連鎖はどれほど漏れがあるのでしょうか?先生が私に教えてくれたとき、子供の頃の私はその連鎖の一貫性について非常に懐疑的でした。
第一に、私は超オタクで無知で頑固でした。第二に、私は共産主義の東ドイツに住んでいたので、デフォルトで先生が教えてくれることはすべて間違っていました。また、私は国家のプロパガンダをあまり信じない芸術家の家族出身で、家には大量の本がありました。
何百年も前に本を書いた多くの人々と、先生たちよりも共通点が多いことに気づきました。なぜなら、彼らはより厳密に考え、私が持っていた考えを先生たちとは違う方法で大切にしていたからです。
非常に頻繁に、もちろん先生たちは実践で検証され、実践で機能してきたモデルを与えてくれます。しかし、形而上学的な質問をすると、彼らは通常興味さえ示しません。そして答えを与える時、それらの答えは浅かったり間違っていたりすることがよくあります。
物理主義のような理論があると、それは実際に何を意味するのでしょうか?現時点で私にとって、物理主義は現実に閉じた機械的な層があり、私たちが直接その上に随伴しているということを意味します。
完全に機械的な物理的宇宙があり、その物理的宇宙の中にネードが操作するコンピューターが存在し、あなたはそのコンピューター内のシミュラクラとして存在し、あなたの周りの世界は任意のものかもしれません。しかし、これは物理主義の世界ではありません。
例えば、マインクラフトに住んでいるとしても、マインクラフトが物理的なコンピューター上に存在するとしても、これは物理主義ではありません。なぜなら、あなたが直接物理的な機械的層の上に随伴しているわけではないからです。あなたが観察する規則性は、物理学の最低レベルで起こっていることの結果ではなく、プログラマーの恣意的なアイデアの結果にすぎません。
では、物理主義を超えた代替案は何でしょうか?シミュレーション理論を超えて、この閉じた機械的層があるという考えを超えて、他に何があるのでしょうか?これはどのように機能するのでしょうか?世界に基盤がない場合、それはどのように見えるのでしょうか?それとも、それは単なる陰謀なのでしょうか?私にはこれについて考える方法がわかりません。
宇宙は最低レベルでは、なぜ何もないのではなく何かがあるのかを説明するようなトポロジーかもしれないと考えることはできます。そして、すべての可能な演算子を同時に適用することで分岐する多元宇宙を見ます。そうすると、私がこのような数学的トポロジーとして存在するであろうすべての可能な現実の空間の一つの枝にいるという可能な説明に至ります。
これは究極的には物理主義的な世界観ですが、学校の先生が物理主義と呼ぶものとはかなり異なります。
また、物理主義を正しく理解するためには、私たちが見ているものがデカルト的な意味での「延長実体」ではないことを受け入れる必要があります。デカルトは、物に触れたり、空間の中にいると観察したりするときに直接知覚しているものが、ある意味で物理的宇宙だと考えました。
しかし、もちろんそうではありません。それはあなたの脳が生成するゲームエンジンです。物理学には色や音はありません。それらはあなたの心の中にのみ存在します。
したがって、夜の夢が昼間の夢とそれほど違わないことを受け入れなければなりません。昼間の夢は、あなたの心の外にあるパターン生成器によって安定に保たれている感覚データをモデル化するために調整されているため、はるかに安定しているだけです。この生成器を私たちは物理的宇宙と呼んでいます。
この意味で、私は二元論者だと言えるかもしれません。なぜなら、知覚する存在として、究極的にはソフトウェアの状態遷移として実装された因果構造として存在する表象の層があることを受け入れているからです。これは異なる基盤上に実装され、表象のために使用できるという事実を超えて、実際の物理的ダイナミクスを無視しています。
そして、これらのすべてを可能にする物理的宇宙がありますが、私は決してこの物理的宇宙を訪れることはできません。なぜなら、私は物理学の中で意識的ではなく、自分の心の中の、自分の表象の中の現実の夢の中でのみ意識的だからです。
あなたが理論の選択を制約するものは、その理論を機能させることができるかどうかだと言われましたが、例えば汎心論の場合、それが機能するとはどういう意味なのか疑問に思います。人間の意識をどのように説明するかについて、説得力のある説明的な物語を語ることができるという意味なのでしょうか?それとも、これはコンピューター科学に戻りますが、汎心論を使って意識的なAGIをプログラムする方法がわからないという意味なのでしょうか?
汎心論をどのように形式化し、実際にそれを説明するのでしょうか?観察可能なもの、観察可能なものを実現する構造、そして例えば説明したい意識の現象学との関係はどのようなものでしょうか?それらはどのように関係しているのでしょうか?
私は、多くの汎心論者がこれを満足のいく方法で説明できないと感じています。基本的に意味をなすか、あるいは計算的機能主義と異なる方法で説明するかのどちらかです。
おそらく一歩下がって、計算的機能主義が何を意味するのか説明する必要があります。
まず、機能主義は認識論的立場です。認識論とは、現実について何を知ることができるか、そして私たちが知っていることにどのようにアクセスするかについての理論です。
機能主義では、行動に基づいてオブジェクトを構築するという考えがあります。例えば、ある意味で不変である物理的現実の特定の側面の行動に基づいて、水分子の概念を構築します。
水分子を分割できることに気づきます。多くの水分子を組み合わせて液体である水を作れることに気づきます。そして、特定の温度でこれらの分子の組み合わせとして水を説明できます。これらはすべて行動です。
水分子の本質、観察可能な行動を超えたものと接触することは決してありません。私たちが水分子として構築するものはすべて、その現象に関連するすべての観察を規則化し抽象化しようとした結果です。
この特定の単一の現象によって説明できるという考えは、機能主義の観点から意味をなします。なぜなら、水分子は世界の他の情報との相互作用につながる一連の機能を記述しているからです。
この観点からは、物理学に水分子とあらゆる点で同じように振る舞い、水分子のすべての特性を正確に共有し、可能なあらゆる測定で水分子と同じ結果を示すが、水分子とは異なるオブジェクトが存在すると言うのは意味をなしません。
なぜなら、私たちは水分子の概念を他のものからではなく、観察した行動からのみ得たからです。
機能主義の代替案は、ある種の本質主義でしょう。行動を超えて何らかの方法で私たちに知られる隠れた本質があるというものです。しかし、それがどのように機能するのかわかりません。そうでなければ、それが観察可能な行動であれば、再び私たちが観察した特性であり、何らかの機能に翻訳されることになります。
もう一つの側面は計算主義です。これは表現に関する立場です。基本的に、任意のものを状態遷移を使って表現またはモデル化できるということです。状態遷移によってモデル化できないものがあると言うのは、馬鹿げているわけではありませんが、非常に大胆な主張です。
なぜなら、それは物理学者たちが何かを見逃しているか、あるいはモデルを作る人全員が何かを見逃していることを意味するからです。それは何であるべきなのでしょうか?
私は、この計算主義的機能主義の立場は、表現がどのように機能するか、そして認識論がどのように機能するか、つまりオブジェクトがどのように構築され、それらのオブジェクト上で知識がどのように構築されるかについての比較的基本的な考えだと思います。
この立場を攻撃しようとし、誰かが「意識の非機能的理論を構築しよう」と言うとき、私は非常に興味を持ちます。
例えば、ジュリオ・トノーニはIIT(統合情報理論)でこれを試みていますが、IITは情報理論的な規則性を使って意識を記述しようとしています。つまり、これらは機能です。これは難しいです。
なぜなら、どの時点で彼は機能主義的ではないものを理論に導入でき、しかも哲学者や科学者として扱えるような概念を導入できるのでしょうか?
私には、行動を通して自らを明らかにしない本質が存在するという信念は、迷信のように思えます。それは心の中で構築する何らかの直感に基づいているようです。しかし、その直感を注意深く検討すると、それが空虚であることに気づきます。その直感と他のシステムとの間に形式的な差異を実現するものを構築する方法がないのです。
誰かが汎心論者で、例えば意識が宇宙に分散している物質の側面であり、宇宙のどこにでもあると言うとき、おそらくこの人に「宇宙のすべてのものが同じように意識的なのですか?」と尋ねても、それは望んでいる答えではないでしょう。
麻酔をかけられた人とそうでない人、死んだ人と生きている人、あるいは人々の間の空虚な空間の間には、現象学的に何らかの違いがあるように思えます。したがって、空虚な空間で何かが起こっているとしても、それは特にあなたの有機体、特にあなたの脳の中で意識に関して起こっていることとは程度が異なります。これを何らかの方法で説明しなければなりません。
しかし、物質の構造的特性に依存し、特定の構造的特性の密度が一定以上になった時にのみ現れるという形の汎心論を持つなら、ソフトウェアの座は世界のどこにでもあり、それを実行している機能的構造に応じて異なる程度で実装されていると言えるかもしれません。
そして、この構造がいつ存在するかの基準を特定すればするほど - 例えば、制御システム、エネルギー消費、基盤の安定性など - あなたの汎心論理論はどんどん標準的な機能主義に近づいていきます。
あなたが抜本的な一歩を踏み出し、「あなたの観察はすべて実際には意識とは何の関係もない。麻酔をかけられたり脳が破壊されたりした時にあなたが異なる行動をすることは、意識にとってまったく無関係である。なぜなら、意識はこれよりもずっと根本的なものだから」と言わない限り。しかし、そうすると我々はもはや同じ現象について話しているのではなく、あなたの根本的な何かについてのアイデアが、私が観察し理解しようとしているものにもはやマッピングできなくなってしまいます。
意識についての次の大きなブレークスルーをもたらすのは、哲学者なのか、神経科学者なのか、コンピューター科学者なのか、それとも他の分野の研究者なのか、あなたはどう見ていますか?それともすべてなのでしょうか?表象については哲学者たちがよい仕事をしていないとおっしゃいましたが。
哲学者たちが表象について良い仕事をしていないとは思いません。非常に賢い哲学者たちがいて、最高レベルの分析哲学を行っています。ただ、哲学という分野の主流を見て、現在哲学のカノンに入っていくものを見ると、ゲーデルさえもまだ消化されていないと感じます。
哲学で教育を受け、主流の文献を読み、哲学の学位を持っている人に、ゲーデルの証明を要約してもらっても、形式論理で良い教育を受けたコンピューター科学者と比べて、おそらく十分ではないでしょう。これには少し驚いています。
ゲーデルの証明についての要約や本さえも、それを数学の博物館にある一種の彫刻のように扱い、非常に重要で重大なものですが、実際には現実についての私たちの考え方を変えるものではないと扱っています。しかし、理解すれば変えるべきなのです。
では、意識の理論をさらに発展させるためのインスピレーションや示唆を誰に求めていますか?
多くの分野に非常に多くの個人がいます。賢い一般主義的思想家がいない分野はないと思います。しかし、現時点で私が非常に刺激的だと感じる人々の一人は、マルコ・イオリオです。最近彼と話されたのを見ました。
彼は、チョムスキーに帰属したものの一バージョンを言っています。生物における発達の仕方と、心の中での表象と組織化の仕方には大きな類似性があるという意味で。おそらくこれは主に時間スケールの違いであり、単なる表面的な類似性ではないかもしれません。
したがって、生物で観察される自己組織化の原理が、心の自己組織化を理解する上で重要である可能性があります。また、非常に遠くにズームアウトすると、これらの原理の多くが社会の組織化や、もちろん組織の組織化に反映されているのを見出すかもしれません。
しかし、社会が人々と同じ方法で意識的であると主張することは意味をなさないと思います。同様の理由で、生物自体が神経系が生み出す意識と同じ方法で意識的であると先験的に仮定することは意味をなさないと思います。
神経科学では、この意識の問題にある程度取り組んでいる人々の数は多いです。例えば、最も有名なチームの一つはスタニスラス・デアンヌが率いています。この分野で重要な貢献をしている人々は多くいます。
アントニオ・ダマシオやマイケル・グラツィアーノなども影響力のある一連のアイデアを持っています。グラツィアーノの注意スキーマ理論などがあります。
一方で、トーマス・メッツィンガーやデイビッド・チャーマーズのような非常に賢い哲学者たちもいます。彼らはこれらの問題について深く考えています。
しかし、最終的に進展するためには、検証可能な理論に移行する必要があると思います。ほとんどの分野は現在、自らの落ち度ではありませんが、非常に良い方法論的枠組みを持っていません。
心理学が皮肉にも心の研究をやめ始めた理由の一つは、心理学が心が非常に多くの変数を持つシステムであることを理解したからです。既存の統計的手法を使って実験室でその理論を検証することはできません。
検証可能な理論がないのなら、それは科学ではありません。そこで心理学は、実践や文学形式のようなものになるのではなく、科学であることを選択しました。
例えば、ウィリアム・ジェームズの心理学の哲学における心理学は、そこまで非科学的ではないと思います。それは、人間の発達、人間の表象などを理解するために必要な、心の哲学と科学としての心理学の間の学際的なものです。
ある意味で、これらの分野はもっと大胆になり、より多くの哲学を行う必要があると思います。哲学もまた、他の哲学者が言ったことについて書くのではなく、私たちが観察し、まだ説明できない現象を実際に記述することに戻るためにもっと大胆になる必要があるかもしれません。
意識と人工知能を結びつけるために、まず知能の定義をテーブルに載せる必要があるかもしれません。人工の部分は置いておいて、あなたは知能をどのように考えていますか?
現時点で、私は知能をモデルを作る能力だと考えています。
そう、何をすべきかわからないときに使うものが知能だと言えるでしょう。知能は単にスキルを持っていたり、スキルを展開したりすることではありません。
例えば、事前に定義されたアルゴリズムを単に実行しているチェスコンピューターは、それ自体では知的ではありません。たとえ人間が知的である必要のあるタスクを実行していても。
しかし、この新しいモデルを作る能力、通常は制御のためのモデルを作る能力が知能です。この定義方法で気に入っているのは、パフォーマンスや成功について何も言っていないことです。
人々は非常に知的でありながら、賢明でもスマートでもないことがあると観察します。賢さやスマートさは知能とは少し異なります。それらは目標合理性などと関係があります。
一部の人々は基本的に、調整の欠陥や賢明さの欠如を、より知的になることで補償します。より多くのモデルを作ることで。これらのモデルは非常に詳細で非常に巧妙かもしれませんが、実際には役に立たないかもしれません。
知能は認知機能の特定の領域で展開する特定の能力です。それはエージェンシーと同じではありません。
例えば、あなたが会社のCEOであるとき、おそらく最大化すべきなのは知能、つまりモデルを作る能力ではありません。むしろ、あなたが持つ目標を追求する中で実際に問題を解決する能力を最大化すべきです。知能は必要な場所で展開すべきですが、問題があるからといって常に問題を解決することに時間を費やすべきではありません。多くの非常に知的な人々は、そのような追求を専門にすることを本当に楽しんでいます。
これは、会社や研究チームのような組織で重要な役割を果たすことを意味しますが、宇宙で成功したいのなら、モデルを作る能力自体が最も重要なことではありません。
したがって、私は知能とエージェンシーを区別します。エージェンシーは未来を制御する能力です。知能はモデルを作ることと密接に関連しているため、問題を解決する能力と非常に密接に関連していますが、それらの問題を解決することではありません。なぜならそれには知能を展開することが必要だからです。
行動も必要ですし、正しいモデルを作り、それらを特定の方法で評価することも必要です。しかし、知能はある意味で、IQテストで測定するのは人々がパズルを解く能力だと言えるでしょう。
人工知能は、単なる知能とどのように異なるのでしょうか?
人工知能はある意味でスローガンです。1950年代にマービン・ミンスキーとジョン・マッカーシーらによって始められた分野です。コンピューターが新しいパラダイムを提供していることを認識して始まりました。
マービン・ミンスキーは人工知能をサイバネティクスの代替および拡張として位置づけました。この分野の創始者や参加者の多くはサイバネティシャンでした。サイバネティクスは、制御理論やフィードバックループを使って、モデルを作る能力や究極的には心を記述できるという考えでした。
計算はこれを一般化する方法です。制御する連続的なダイナミクスの概念から、何でも記述できる自動機械へと移行します。これには、それらのフィードバックシステムや制御システムも含まれます。
初期には、サイバネティクスのアプローチとコンピューターサイエンスのアプローチ、AIのアプローチの間にある種の対立がありました。なぜなら、古典的なAIは主に記号システム、離散システム、それらの演算子を組み合わせて望む構造を構築する方法を見ていたからです。制御のことに直接向かうのではなく。
そこで、何が最も基本的かという疑問があります。基本的なレベルで始めるべきなのは、連続的な制御のこと、力学系なのか、それとも自動機械の世界なのか。
我々はこれらがある意味で同等であることを示すことができます。制御構造から自動機械を構築でき、実際にトランジスタを構築するときにそうしています。制御構造を非常に大きくして、マルチステーブルなトランジスタを生成するのに十分安定するようにします。
その上に離散論理を構築し、それによって算術を行い、線形代数を行い、そして再び連続的なニューラルネットワークを構築します。そしてニューラルネットワークを訓練して、再び離散的な言語を話すようにします。このように、層を重ねることができ、離散的な論理的なものと連続的な制御的なものの間を行き来します。後者はより幾何学的です。
しかし、ミンスキーはある意味でサイバネティクスに反対しました。この計算的自動機械アプローチがより基本的だと考えたからです。彼はニューラルネットワークとサイバネティクスの両方に積極的に反対し、コンピューターサイエンスに亀裂を生みました。
振り返ってみると、これはあまり良い亀裂ではなかったと思います。分野を超えてアイデアを結びつけることが遅れる原因となったからです。
現在のAIの波と、それが何であり、どこに向かっているのかについて、あなたが話したいと言っていたことの一つについて聞きたいと思います。
現在のAIの波が実際に何であるかを言うのは難しいです。なぜなら、それを見る方法がたくさんあるからです。それはディープラーニングなのか、トランスフォーマーなのか、LLMなのか。特異性の程度が異なります。
しかし、ある意味でディープラーニング革命は2000年代に始まったと言えるでしょう。人々は、ほぼ任意の数の層と、ほぼ任意の数のパラメーターを持つニューラルネットワークを訓練することが可能であることを発見しました。ただし、より多くのデータとより多くのコンピューティングを使う必要があります。
そして、人々はこれを効率的にする一部のアルゴリズムを考案しました。そのため、インターネット全体や数億枚の画像など、大量のデータで実際に訓練することが可能になりました。
この点で発見された最初のアルゴリズムはトランスフォーマーでした。トランスフォーマーは、ディープラーニング革命後のブレークスルーでした。基本的に、何について統計を取るべきかについて選択を行うことを発見しました。
トランスフォーマーの一つの側面は、前の層で何に注意を払うべきかをニューラルネットワークに訓練させることです。すべてを同時に見るのではなく、現在のコンテキストで最も重要なものを学習します。
トランスフォーマーのもう一つの非常に重要な側面は、これを並列化可能にしたことです。そのため、分散GPUファームで高速に実行できます。より速くしたい場合は、1つのCPUでより長く計算するのを待つのではなく、より多くのGPUに分散させることができます。
インターネット上のすべてのテキストで訓練するコツは、これも並列化することです。これが現在の進歩のほとんどを推進しています。
ほとんどの人々は、これが答えではないが、答えの重要な部分であることに同意していると思います。スケーリング仮説は基本的に、現在のアルゴリズムのクラスが、ひねりや改良、そして途中で行う重要な洞察とともに、人工一般知能（AGI）に到達するのに十分だろうという考えです。
AGIという概念は、ある意味で最初のAI冬の後に出てきました。最初のAI冬とは...1950年代にミンスキーがコンピューターに考えることを教えるというアイデアを思いついたとき、彼はこれはそれほど長くはかからないだろうと考えました。おそらく思考と学習の一般化を理解し、それをコンピューターに実装できるだろう。そして、コンピューターが十分に大きくなるのを待つだけですべてが順調に進むだろうと。
ある時点で彼は、4年から400年かかるかもしれないと言いました。
ああ、そうですか。この時点で彼はすでに一歩後退したのですね。
そして1970年代、1972年に、エジンバラのチームがロボット工学とAIのアイデアと野心を組み合わせたAIプロジェクトの新しい資金調達を試みました。王立協会は、これを研究するために部外者を置きました。それはサー・ジェームズ・ライトフィルでした。彼は大気科学者であるだけでなく、多面的で非常に賢い人物でした。
彼はデニス・ミッチーとうまくいかず、基本的に、リークされたレビューでこのプロジェクトに資金を提供すべきではないと推奨しました。彼の主な議論は、コンピューターロボットを作ることは理にかなっているし、人間の脳のモデルを作ることも理にかなっている、例えばニューロンの機能のモデルを作ることも理にかなっているが、人間のような心を持つロボットを作ろうとすることは意味がないというものでした。
元のAI研究者たちやジョン・マッカーシーらは、それはポイントではないと説明しようとしました。ロボットについてではなく、心を構築すること、学習し、一般化し、抽象化できるシステムを構築することについてだと。そしてそれは可能だと彼らは考えていました。必ずしも生物学的な脳が行っていることを正確に模倣したり、ニューロンや神経化学を理解しようとしたりする必要はありません。むしろ、脳が行っていること、計算していること、その背後にある数学的原理を理解する必要があるのです。
私たちの社会には大きな文化的反対があると思います。これは西洋のキリスト教社会および脱キリスト教社会に特有の特徴かもしれません。私たちがいる世界は一種のシミュレーション、一種のマインクラフトのようなものであり、私たちの魂はこの世界の外側に座っているという二元論的な考え方です。真の心は自然の世界のものではなく、自然の機械的物理学の層の外側にあり上にある超自然的なものであり、それが自然と対話し相互作用しているのです。
私たちがNPC（ノンプレイヤーキャラクター）である可能性、つまり物理的世界内のパターン、マインクラフト内のパターンに過ぎない可能性があるという考えは冒涜的です。それは私たちが自分自身をどのように認識しているかへの侮辱です。
私はこれが、このライトフィル報告の背後にある部分的な理由だと思います。この報告はほとんどのAI研究への資金提供のキャンセルにつながりました。
ああ、そうですか。
これが「AI冬」と呼ばれるものにつながりました。基本的に1973年に私が生まれた時、私は最初のAI冬の中に生まれたのです。
1980年代には、ルールベースのシステムと論理に進展がありました。そして専門家システムが登場しました。専門家システムは有名にAIにスケールしませんでした。
ある意味で、ディープラーニングだけがこのウィトゲンシュタインのパズルを解決しています。言語を現実に根付かせることはどのように可能なのか、意味のあるものを表現するシステムを構築することはどのように可能なのか。
LLMの心のような構造や可能性についてどれほど楽観的であるかに関わらず、それらが「意味する」ということが何を意味するのかという問いに答えることができるのは明らかだと思います。なぜなら、意味とは現実の統合モデルへの参照だからです。
興味深いのは、LLMが宇宙全体の統合モデルを構築できることです。
それはどういう意味ですか?
意味について話すとき、私たちは自分自身の外側の何かを指しているわけではありません。哲学の一部の領域には真理の参照理論がありますが、私には機能させる方法がわかりません。なぜなら、私の言語の外側に矢印を作る方法がわからないからです。
これは数学者たちが長い間発見し、議論してきたことです。タルスキの定理などがそうです。表現のシステムが自分自身の外側を指すことは不可能です。これはゲーデルも認識していたことです。
彼の数学について話す方法は、彼の数学のために使用する言語の定義について話すことを必要とするでしょう。その定義は外側にあるはずです。これを行う方法は、言語を自分自身の内部で再構築し、エミュレーターを構築することです。
ゲーデルは彼の証明のために最初のエミュレーターを構築しました。彼は論理的言語を論理的言語の中でエミュレートし、それによって内部への参照を可能にしました。
私は、私たち自身についても同じことが真実だと信じています。精神状態にあるということは、その精神状態にあることが何を意味するのかを知っているということではありません。あるいは、その精神状態にあることさえも。私たちはその精神状態にあるという自分のモデルを作る必要があります。
つまり、私たち自身のシミュレーションを自分の中に構築する必要があります。そのシミュレーションは機能的に同等ではありません。もちろん、それは私たちがどのように機能するかの特定の特徴の単純化や抽象化です。
しかし、十分な能力があれば、私たちが実際にどのように機能するかのモデルを作ることができるポイントに到達する可能性があります。私たちがどのように機能するかのモデルを作ることができれば、私たちは十分に複雑ではないだろうと主張する人々もいます。それはパラドックスになるだろうと。
しかし、私はそうは思いません。それは単に、どれだけのメモリーを持っているか、システムにどれだけの冗長性があるかの問題です。なぜなら、もちろんあなたはすべての記憶を説明する必要はありません。記憶を形成し、過去の状況の想起として経験し、すべての精神的操作のコンテキストでそれらを使用する方法を説明する必要があります。
そのためには、すべての詳細を説明する必要はありません。この機能性をすべて説明するために、いくつかの非常に特定の記憶を作成するだけで十分です。
同様に、LLMをLLMの作り方について書かれた論文で訓練し、LLMがどのように機能するかを人間に説明できるだけでなく、LLMを作るためのコードを書き、さらにはそれを修正することさえできるようになるはずです。
現在の技術の限界と可能性について質問に戻ると、答えは誰も本当にはわからないということです。一部の人々は強い考えを持っています。より予測的なモデルを作るためにより多くの訓練を行うだけで、これらのモデルもより良く推論できるようになり、最終的には言語を自己プレイに変え、このものが自分自身と推論し、訓練データにない例えばリーマン予想を導き出すことができるようになるという強い賭けをする人々がいます。
一方で、これは停滞する可能性があり、自己改善し、私たちと同じくらい効率的に学習する知能を得るには、まったく異なる角度から見る必要があるという人々もいます。
両側とも、LLMが人間の心が機能する方法ではないということにある意味で同意していると思います。テキストデータから構造を抽出するのに非常にうまく機能するだけのものです。これは、チョムスキーが私と話したときに強調したもう一つのことです。彼は、LLMを研究しても人間の心や人間の言語がどのように機能するかについては学べないと言いました。
後者については、そこまで確信が持てません。言語は究極的に特定の問題の解決策です。その問題とは、ある種のファジーな階層的ハイパーグラフである心的表象を、別の人間が同等の表象を自分の心の中で構築できるように翻訳する方法です。
これを実現するためには、心的表象を学習可能で、また非常に限られたリソースで解釈可能なプロトコルに制約する必要があります。私たちの脳には非常に限られたリソースしかありません。なぜなら、安定した方法で任意の操作を実行することができないからです。
例えば、言語を解析するとき、並列化可能な方法で解決できない特定の問題があります。コンピューターでは、数百万バイトの深さのスタックを作ることができ、それは大きな問題ではありません。しかし、人間の心では、4レベル以上の間接参照を行うと、何が起こっているのか追跡できなくなります。同時に多くのボールを空中に保つことができないからです。
ある意味で、人間の言語は、心的表象を離散的なシンボルの文字列にマッピングする制約を受けています。これらのシンボルは学習可能なほど少なく、スタックの深さが4程度で解析可能で解釈可能でなければなりません。
これは可能な解決策の空間を定義し、私は人間の言語がおおよそその空間と一致していると推測します。ある意味で、その空間によって与えられる解決策です。
すべての人間の言語に共通する基準を発見したい場合、複数の言語を学習したLLMのトークンの共通点を評価できるでしょう。
チョムスキーが強調していたのは、LLMが人間には学習できない「不可能な」言語を学習できるという事実は、それらが私たちの言語学習能力とは全く異なる方法で機能しているという証明であり、LLMを使って人間の言語について学ぶには似すぎていないということでした。
一方が他方から必然的に導かれるとは思いません。前提はもちろん真です。LLMの訓練は、私たちが言語を学習する方法とは非常に異なります。私たちはLLMと同じ方法で言語を学習することはできません。
一方で、LLMは単に非効率的というわけではありません。言語を学習する前に大量のデータを与える必要がありますが、LLMを訓練してそれを行うと、訓練データにない新しい言語の辞書と文法を与えて、それを内在化し、すぐに人間の話者のレベルでその言語を使用することができます。
人間の話者はそれほどすぐにはできません。なぜなら、人間の話者はすべての単語を暗記し、文法を外挿して理解するためにもっと練習が必要だからです。
LLMに落ちる部分は、人間の脳よりもはるかに多くのリソースと、構造を表現するためのはるかに強力な方法を持っているからです。これは人間の脳には利用できません。
したがって、LLMは人間の脳よりも効率的でもあり、効率的でもありません。しかし、LLMは表現構造を構築しています。この表現構造は言語使用に合わせられています。LLMが発見している構造と、脳が発見している構造の間に、ある程度の粗視化のレベル、ある抽象化のレベルで類似点がないとしたら、それは驚くべきことでしょう。
私たちは視覚でこれを見つけます。例えば、画像を再現できるようにエンドツーエンドのシステムを訓練すると、このビジョンモデルの階層が人間の脳の視覚モデルの階層とかなり似ていることがわかります。
ニューラルネットワークがニューロンと1対1で比較可能な方法で機能していないにもかかわらず、基本的に脳領域の多くの等価物をニューラルネットワークの層に見出します。
これは、クリス・オラが「普遍性仮説」と呼ぶものです。基本的に、十分に一般的な表現基盤があり、与えられた問題に十分長く訓練すると、異なるモデリングアプローチが、ある意味で同様のモデル構造につながるというものです。
この生成的または理解的な知能の定義を考えると、ChatGPTなどの現在のAI技術の主要なものが、どの程度知的であるとあなたは考えていますか?
LLMは、人間が知的ではない特定の時間スケールと文脈において知的であることができ、他の場合では人間が知的である場合もあるように思えます。
現在のアプローチの問題の一つは、私たちが展開するシステムが基本的に幻覚を引き起こすということです。これはまた、人間の心の性質でもあると思います。
私は、脳に常にオンになっている基本的な幻覚能力があると推測します。しかし、もう一方には批評家がいて、これらの幻覚を切り捨てています。例えば、感覚データに対してテストし、視覚システムの幻覚が視覚データをうまく予測できない場合、基本的に刈り込まれ、予測的なものだけが続きます。
しかし、夜に眠るときのように、感覚入力から解離すると、もはや感覚入力がありませんが、この視覚モデリング領域はまだアクティブです。それは現在の状態の継続を生成し、これらは夢として展開します。基本的に、自由に実行される幻覚です。
多くの点で、LLMがテキストを継続するときに生成しているものは、非常に似ていると言えるでしょう。
人々はこれを非常に問題視しています。なぜなら、インターネットでモデルを訓練し、常に事実に正確であることについては訓練せず、インターネット上のテキストのように生成するように訓練すると、存在しない人々についてのWikipedia記事を与えることができるからです。
これは、LLMをWikipediaの代わりに使おうとする文脈では大きな問題です。新しい存在しないトピックについて新しいWikipedia記事を書くためのアイデアを得ようとするのではなく。
おそらく、これは人間の脳と同じように推論し、真実の情報を与える能力においてLLMが比較可能ではないことを明確に伝える必要があるタスクです。しかし、新しいアイデアを思いつく能力においては、ある程度人間の脳に比較可能です。
ただし、これらのアイデアをテストすることはできません。なぜなら、主にワンショットの形式で行っているからです。人間が一つの連想を生成し、その連想をリハーサルせずにテキストとして綴ることと同じように。
通常、問題を解決しようとしたり哲学的なアイデアを展開したりするとき、その直感を最終的な出力として使用することはありません。その直感に立ち返り、批評し、見つけたすべての抜け穴を探し、それを刈り込み、機能するものに絞り込みます。これは一度ではなく、何度も繰り返すプロセスです。
これが現在のアプローチでは欠けているものです。AI企業で働いている多くの人々は、その間、これらのモデルをより創造的でなくなるように微調整しています。信頼できる、または信頼性の高いものでモデルを訓練し、信頼性が低いように見えるものを生成することにペナルティを与えます。
その結果、モデルはより信頼性が高く、より権威的に見えるものを生成する傾向がありますが、これはおそらくさらに問題があると思います。なぜなら、今や権威的に見えますが、基本的に理解している人をエミュレートしているだけだからです。
実際にWikipedia記事なのか、偽のWikipedia記事なのか、あるいは単に意見を持ち、社会的に動機づけられているだけのジャーナリストの意見記事なのか、本当にわからなくなります。
基本的に、一部の人々がソフトサイエンスと軽蔑する社会科学のようになります。再現性を必要としないことを言っても許されるからです。なぜなら、それが公表可能かどうかの基準は、それを公表することで得られる社会的な評価に依存しているからです。
言っていることが真実かどうかを決定する厳密で迅速な分析的基準や経験的基準はありません。それは完全に社会的な基準です。
ある意味で、LLMは緩和しない場合、このように機能します。そして、より権威的に聞こえるようにすると、再び創造的になろうとするのは腹立たしいことです。なぜなら今や、間違っていて、創造的でないことに固執することにも頑固だからです。
これは私にとって大きな問題です。特に、例えばLLMを取り、哲学者たちがコンセンサスの答えを持っていない興味深い哲学的質問をし、そのものが存在しないコンセンサスをエミュレートしようとする場合です。
あなたの回答の冒頭で爽やかだと感じたのは、「ある文脈では知的であり、他の文脈では知的ではない」と言ったことです。人々は非常に大きな人間中心主義的バイアスを持っており、コンピューターや人間以外のものを知的とラベル付けしたくないと思うからです。
例えば、かつてはコンピューターがチェスで人間に勝てば知的でなければならないという考えがあったかもしれません。しかし、コンピューターがチェスで人間に勝つとすぐに、私たちはゴールポストを動かします。
あなたがそのように見ていないことを私は評価します。しかし、次に疑問に思うのは、現在の世代のAIを特定の文脈で知的なものから、はるかに広い文脈で知的なものに、つまり一般的に知的なものにするために、何をする必要があるのかという単純な答えがあるかどうかです。
ある意味で、論理は簡単で常識は難しいと人々が考えたのは皮肉です。そして、LLMがある意味で常識の問題を解決しているが、論理に困難を抱えていることが判明しました。
一方で、これらのシステムは改善しています。現在、数学オリンピックレベルのタスクを解決できるシステムがあります。しかし、私は多くの文脈で、実際に能力のある分野でLLMを使用すると、必ずしも私のレベルの能力に達していないと感じます。
そこで、あらゆる次元で人々を模倣しているLLMが、個人が能力を持つことができる以上の次元で人々を模倣することで、人々を超えるかどうかという疑問が生じます。
私が能力を持たない分野では、LLMはすでに私よりも優れています。これは本当に興味深いことです。特に、例えば書くことができない人や、複雑なテキストを理解できない人にとって、LLMはその分野の弁護士や科学者、哲学者ほど複雑なテキストを理解するのが上手ではないかもしれませんが、そのようなテキストの読み方や書き方を理解していない人よりもずっと優れているでしょう。
これは非常に良い指摘ですね。しかし、それはまた危険性も示しています。なぜなら、あなたが自分で完全に限界を理解できないシステムに頼るようになるかもしれないからです。自分で熟練していないので、それがもはや機能しなくなる場所を本当に理解していないのです。
私にとって良いベンチマークは、まだ理解している分野でプログラミングコードを書くことです。このものは新しいアルゴリズムを書くことであなたを上回ることができますか?そして、どれだけ多くの間違いを犯し、それらの間違いがどれほど論理的ですか?
もちろん、ボイラープレートを書いたり、Stack Overflowで議論されてきた問題を解決したりするのはとても得意です。しかし、複雑な問題を一貫して解決し、それをコードとして表現することは、公に利用可能な主要なLLMでさえ、まだ人間のレベルで解決できないと感じています。
しかし、そのようなプログラマーであれば、それはあなたをより生産的にすることができます。
しかし、あなたがすでにかなり能力のある分野で、あなたの能力以上のコードを書くことができるLLMへの既知の道筋はありますか?
それは未解決の問題です。
しかし、道筋がないとしたら驚くでしょう。もちろん、これに賭けをしている人々がいます。
この問題についてチームで取り組んでいる人々もいます。より長い形式の推論をどのように実現できるでしょうか?
一つの方法は、プログラミングを自己プレイタスクに変えることかもしれません。例えば、AIシステムは自分自身と対戦するだけで、人間よりもはるかに上手に囲碁をプレイするようになります。非常に高速で、十分なリソースを与えれば、数千年の人間の囲碁の経験を1日で上回ることができます。
人間の囲碁プレイヤーは、もちろんゲーム全体を自分で学んでいるわけではありません。エキスパートレベルでは、過去の囲碁プレイヤーの経験を活用しています。チェスのグランドマスターも同様に、以前のチェスプレイヤーの洞察を利用して上達します。
これはLLM、というかAIトレーニングシステムには必要ありません。なぜなら、自分自身と対戦することで人間のゲームのパフォーマンスを上回り、これらのゲームの規則性を発見することができるからです。
そこで疑問が生じます。言語や論理などを自己プレイに変えるにはどうすればよいでしょうか?これには、私たちが使用している論理を第一原理に基づいて根拠づけ、それらの第一原理からどのように興味のあるドメインに到達するかを理解する必要があります。また、おそらく私たちの周りの現実における第一原理についての直感を得る必要もあるでしょう。
偉大な物理学者の心、例えばテスラやマックスウェルなど、最初の無線を作った人々を見てみましょう。私は先生たちに、彼らがどのようにしてこの最初の無線にたどり着いたのか、どのようにしてこれを理解したのかを尋ねました。そして、電磁気学の考え方があり、それが空気中をどのように伝播するかなどがあると学びます。
しかし、どうやってこのアイデアにたどり着いたのでしょうか?地面に棒を置くとフィードバックとして機能し、ほぼ任意の距離で機能し、もう一つが空気を通り、これを変調し、発振器を構築するというアイデアをどのように思いつくのでしょうか?なぜこれが機能すると最初に考えたのでしょうか?
これらの規則性についての理論が詳細に説明されておらず、一般的に利用可能な知識がない状況では、現実がより深いレベルでどのように機能するかについてこれらの直感を構築する人々がいます。
議論によれば、これは私たちが常に行っていることです。社会的領域でどのように相互作用するか、実践的な領域でどのように相互作用するか、幾何学的な証明を試みるときでさえ、数学的な領域でどのように相互作用するかについて、これらの深い直感を持っています。
私たちはしばしばこれらの直感を意識していません。そして、これらの直感の多くをLLMに取り込むことができますが、現時点でLLMはほとんどテキストでのみ訓練されています。ビデオではほとんど訓練されていません。
例えば、フランソワ・シュレットのARチャレンジを与えた場合...シュレットは認知科学者でAI研究者で、Googleで働いています。彼は知能について非常に影響力のある論文を書き、それを一般化し新しいスキルを獲得する能力として定義しています。
彼は、既存のアルゴリズムでは容易には解決できないが、人々にはある程度解決可能なベンチマークを開発しました。彼は小さな子供でも解決できると主張していますが、いくつかのタスクはかなりトリッキーです。
基本的に、ピクセル化されたグラフィックスのようなIQテストです。これらのタスクはそれぞれ新しく、記憶によって解決できないように設計されています。新しい解決策を思いつく必要があります。
もちろん、原則的には、類似の問題の空間を過剰に訓練し、本質的に記憶によって解決する方法を思いつくかもしれません。しかし、これは正しい方法ではありません。人間がそうするのと同じ方法で行うべきです。
おそらく、これを行う方法は、まず物理的な相互作用を観察することでシステムを訓練することかもしれません。例えば、ボールが壁から跳ね返るのを観察するなどです。
そして、いくつかのタスクがあり、基本的にあるピクセル配列があり、それを壁から跳ね返るボールとして解釈すると意味をなすというものがあります。
このピクセル配列をLLMがアクセスできる形式に変換すると、LLMはそれを理解できないかもしれません。
これは、例えばOpenAIがリリースした有名なビデオモデルであるSoraでも観察されることです。時間的な安定性に関して、人間と同じように一般化しません。
例えば、飼い主を起こす猫のビデオがあります。最初の2回このショートループを見ると、非常に印象的で、基本的に何も問題がないように見えます。しかし、よく見ると、ああ、猫は前足が2本左にあります。なぜなら、基本的に2回前足で飼い主に触れているからです。
隣接するフレームだけを見ていると、これに気づきません。なぜなら、隣接するフレームの各ペアまたはトリプレットは問題なく見えるからです。長い時間フレームにわたってのみ、それが一貫していないことに気づきます。
これは、そのものがどのように訓練され、画像を生成するかの結果です。より長い時間フレームにわたって安定するように訓練する方法があるはずです。このものが持つのと同じ特徴の忠実度を持つ前に。なぜなら、それは完全に写実的に見えますが、時間の中で機能しないこの奇妙さに気づくだけです。
AIの発展にあまり触れていませんが、先ほどあなたのTwitterを見ていたと言いましたが、あなたがツイートしていたいくつかのビデオモデルにはかなり驚きました。そこで起こっていることは本当に驚くべきことです。
これらで遊びたくならない人がいるとは思えません。本当に心を魅了されます。現在、ある種の疲労感があると感じます。人々はプラトーに達したと感じているようです。しかし、私はこのプラトーの多くが、過去数年間にあまりにも多くのことが起こったため、もはや興奮できなくなったという私たちの能力の限界によるものだと推測します。
基本的に、毎週見るたびに、非常に多くの前線で起こっている進歩は途方もないものです。もちろん、別のものが来るでしょう。これらの進歩は高価で、これが収益に変換されるのか、あるいはそうならないのかという疑問があります。
先ほど言及した自己プレイのアイデアに戻りますが、例えばChatGPTが高レベルの哲学者、つまり哲学に精通した人をエミュレートできるようになる方法として、このアイデアを理解できているか確認したいと思います。2つのChatGPTモデルが互いに哲学を論じ合うことで、何らかの形で哲学者レベルの哲学論文を作成できるようになるというアイデアでしょうか?
これは別の問題につながります。現在のシステムはオンライン学習用に設定されていません。LLMは静的な訓練データで訓練されており、LLMが作業メモリコンテキスト（基本的にはプロンプト）を持つとき、これを自然言語からモデルの隠れ状態に翻訳し、そして新しいプロンプト状態に投影します。もちろん、言語のすべてのニュアンスを翻訳して戻すことはできないので、何かが失われます。
おそらく、何らかの中間言語に翻訳し、プロンプトコンテキストを離れると失われます。ある意味で、映画「メメント」の主人公のように、現在の作業メモリコンテキスト以外の新しい記憶を形成できない前向性健忘症の人間のように振る舞います。
これをある程度扱うには、記憶術を構築したり、メモを取り、それらのメモにアクセスするプロトコルを構築したりすることができます。また、作業メモリコンテキストを大きくすることもできます。
基本的に、作業メモリコンテキストをデータベースに保存し、データベースが効率的にアクセスするには大きくなりすぎたら、データベースをモデルに再訓練することもできます。基本的にオフラインにして夜に夢を見させ、朝に起きるとこの知識をある程度統合しているようにします。
このように人間の学習をエミュレートすることはできますが、それでも同じことではありません。なぜなら、人間の学習は、新しいアイデアを構築しそれらを内在化するこの建設的な最前線で積極的に起こっているからです。
これを行うには、おそらく少し異なるパラダイムが必要です。例えば、私が現在働いているスタートアップであるLiquid AIが興味を持ち、取り組んでいることの一つは、流動的なシステムモデルを構築することです。これらは常に訓練可能で、原則的にはリアルタイムで起こっていることに基づいてリアルタイムで更新できます。
人間と同じ効率で学習するシステムを構築できれば、基本的に新しく生成されたものや新しい推論の関連性を発見し、それらを正確に正しい方法で統合し、重要な情報が失われないように（破滅的忘却がないように）自身のモデルをその場で編集できるようになります。これにより、人間のようなもの、あるいはおそらく人間を超えるものが可能になるでしょう。
しかし、これには現在のモデルの訓練方法の拡張が必要かもしれません。また、より大きなモデルを訓練し、新しい結果で微調整するだけで補償できるため、これらの拡張を探すための十分なリソースを投入する動機がない可能性があるという難しさもあります。
完全に新しいことを試みて、機能しないかもしれないリスクのある取り組みに戻るよりも、すでに機能しているものにこだわり、それにパッチを当て、より高価で扱いにくくても、同じパフォーマンスを得るためにそれらを積み重ねる方が簡単かもしれません。これも機能するかもしれません。
OpenAIはそれを行っているのでしょうか?
OpenAIは両方を行っていると思います。一方では、既存のモデルをスケールアップするチームがあります。また、現在誰もが行っていると思われる説明可能性にも取り組んでいます。
説明可能性とは何ですか?
これは、モデルに入り込み、モデルが実際にどのように表現しているかを理解しようとすることを意味します。例えば、まだ学習していないモデルがあり、今それが学習したとします。モデル内で正確に何が変化したのでしょうか?
基本的に、特定の方法で互いに相互作用する神経ネットワーク内に実装されたルールがあることに気づきます。これがその振る舞いを生成しています。
ある意味で、神経ネットワークはプログラミングコードです。それは分散され、人間が作ったものではなく、非常に複雑でファジーで、しばしば非常に冗長なプログラムです。それが実際にどのように機能するかを特定しようとすることで、知識がどのように表現されているかについて学び、また、モデルを制約して正確に望むものだけを生成し、それ以外は生成しないようにする方法を学ぶこともできます。
コンピューターサイエンティストではない聴衆の多くにとって、ChatGPTやその他のLLMが本当にブラックボックスであり、その内部で何が起こっているのかわからないということは驚くべきことかもしれません。
それは逆だと思います。多くの人々は、ニューラルネットワークがブラックボックスだと考えていますが、私はそれが完全に真実だとは思いません。
基本的に、学習の数学的原理、データがモデルでどのように表現されるか、どのような条件下でモデルが学習するか、そして何を学習しているのかについて、長い間研究が行われてきました。これはモデルの背後にある理論です。これは非常にオープンで非常に活発な研究分野ですが、これ以上のブレークスルーが期待できない分野だとは言えません。本当に多くの興味深い未解決の問題がこの領域にあります。
しかし、それはブラックボックスからはほど遠いものです。もちろん、モデルがルールベースではなく、ある意味で無原則な推論者である神経ネットワークで作られているため、各ビットが何を意味するかわからず、多くの場合、ビットは何も意味しません。多くのビットが特定のコンテキストで一緒になって、平均して望むものを意味するだけです。
この点で、より脳に似ています。そのため、説明可能性に到達するのはしばしば難しく、神経ネットワークがこのコンテキストで実際にどのように機能しているかをフィルタリングするには膨大なリソースが必要かもしれません。
私が言及した2つのことがあります。基本的に、モデルをスケールアップし、より良いトレーニングパラダイムを見つけることなどと、説明可能性に取り組むことです。しかし、もう一つは、完全に新しいことを試すことです。
もちろん、大規模なチームはすべて、新しいことを試す人々がいます。これはしばしば、他の分野からのアイデアを組み合わせることを意味します。物理学、統計学、ゲーム理論、計量経済学などからです。これらはしばしば、モデルの構築方法やより効率的な表現を構築するための数学的進歩についての重要な洞察につながります。
また、多くの実践的なエンジニアリングもあります。人々はたくさんのアイデアを持ち、「これが実際に機能するかどうかわからない」と言います。そして、予期せずに機能するものもあれば、機能すると思っていたものが機能しないこともあります。
これは、このショーがこれまでに触れた以上のテクノロジーゴシップですが、私は好奇心があります。Apple、Google、Microsoftのような大手の確立された企業も、これらの分野で進展を見せているのでしょうか?それともOpenAIや、Liquid AIなどのスタートアップの方が多いのでしょうか?
私は、これらの企業はすべてある意味で、似たような人々と働き、似たようなことを行っていると思います。互いから人材を引き抜くほどです。彼らは、重要なことを学ぶべきだと感じたときに互いの人材を引き抜いています。
したがって、業界が互いの秘密を守る能力には限界があります。また、すべての大手企業がこの進歩の重要性を認識しているため、最先端の研究のほとんどがもはや公開されていなくても、多くのコアアイデアはオープンです。
これらの大企業の中で行われているため、経済的影響が大きすぎるからです。産業研究ラボにとって、ブレークスルーや秘密のソースを公開するメリットはほとんどありません。
もちろん、学術界はまだ公開に非常に焦点を当てています。しかし、産業界の方が影響力があり、リソースが多く、また人々にとってより興味深いキャリアパスがあるため、最高の人材の多くが学術研究から産業ラボに引き寄せられています。
そのため、本当に興味深い研究の多くは現在、これらの産業ラボで、産業ラボのインセンティブの下で行われています。ほとんどのラボはまだ物事を公開し、コミュニティに還元しようとしていますが、必ずしもその年の進歩を公開するわけではありません。アイデアの体系化により焦点を当てるかもしれません。
例えば、OpenAIが始まったとき、ニューラルネットワークの仕組みを人々が理解するのに役立つ、一般的にアクセス可能な一連の出版物を作成することに大きな努力を払いました。また、AI企業の多くの個人が公に出て、チュートリアルを作成し、人々が始められるようにしています。
非常に大規模なモデルを大規模なサーバーファームで調整し、OpenAIと競争しようとしているのでなく、単にこれらがどのように機能するかを知りたい、自分でマシンラーニングのスタートアップを立ち上げられるレベルに到達したいだけなら、この情報はこれまで以上に利用可能でアクセス可能です。
これは大部分、業界内の理想主義的な個人たちが座って、YouTubeチュートリアルを作成し、本を書き、一般的にアクセス可能なツールを書き、オープンソースイニシアチブなどを行っているおかげで起こっています。
もちろん、多くの人々は大手ラボで働きたくないか、非常に有能であるにもかかわらず大手ラボで仕事を得られず、代わりにこれらのオープンソースイニシアチブに取り組んでいます。
例えば、Facebookがフロンティアモデルを公開していることは非常に有用でした。これらはOpenAIの主要モデルと同レベルの能力を持つと議論されています。これにより、学術界内外の個々の研究者や小規模な研究グループが集まり、これらのモデルを使用し、改良し、それらがどのように機能するかについて新しい洞察を得ることができます。
Stability AIがStable Diffusionの重みをリリースしたことにより、すでに多くの研究が行われています。データやすべてのアルゴリズムではなく、重みだけをリリースすることは真のオープンソース研究ではないという議論もありましたが、それでも非常に有用です。
この時点で、あなたが以前言及したことに戻りたいと思います。それは、AIの今後の可能性と未来についてです。もちろん、良い可能性と非常に悪い可能性があります。悪い可能性の方がより刺激的でエキサイティングだと思います。最近、ニック・ボストロムのユートピアに関する本について彼と話しました。その本を読みましたか?
はい、興味深かったですね。しかし、おそらくユートピア的な側面は後回しにして、まず一般的に、AIを恐れる必要があると思いますか?
いいえ、そうは思いません。まず第一に、恐れが制御に役立つ場合にのみ、制御できるものを恐れるべきです。
恐れは感情であり、感情は環境の事物に対する非自発的な反応です。したがって、恐れは正当化されるかもしれませんし、正当化されないかもしれません。また、役立つかもしれませんし、役立たないかもしれません。これらのことを区別する必要があります。
まず第一に、変えることができないものを恐れている場合、その恐れは衰弱的かもしれませんが、役立ちません。正当化される可能性はありますが。例えば、核戦争を恐れるかもしれませんが、主要な政府に核兵器を廃棄するよう説得する方法がないため、何もできません。核戦争の可能性があるという確率に対処するしかありません。
また、別のことがあります。私は1980年代に核戦争の恐怖の中で育ちました。それは蔓延していました。誰もが、次の世紀に入る前に、誰かが愚かにも鳥を incoming missile と間違えてボタンを押すような事故で、世界的な核戦争が起こる可能性が非常に高いと知っていました。
このようなことがほぼ起こりそうになったというエピソードもいくつかあります。
今、私はこの恐れが誤りだったのではないかと考えています。なぜなら、これらの核兵器を実際に配備した人々が、非常にインセンティブ化された階層で働いている有能で賢い人々だということを理解していなかったからです。何かが起こる可能性は、心配する科学者たちに導かれた一般大衆が考えていたよりもはるかに小さかったのです。彼らのシステムは、一般大衆が考えるよりもはるかに間違いを起こしにくいように構築されています。
これは、素人として恐れが正当化されるかどうかを見極めるのが難しいということです。これは、AIについて心配することの2つの側面につながります。
まず、あなたの恐れは有用ですか?その恐れは、良い結果の可能性を高める行動につながりますか?それともただ衰弱させるだけですか?あるいはカルトに導くだけですか?
もう一つは、それが適切かどうかです。つまり、それは現実の良いモデルに基づいているかどうかです。
現在、イーロン・ヤツコフスキーのような人々によって始められたと言える運動があります。彼らは次のように推論しました：AIが起こることはほぼ避けられません。なぜなら、それは価値があり、物理的に可能だからです。そして、それがほぼ確実に主体性を持つようになり、主体性を持てば自己改善し、自己改善すれば私たちと競争し、私たちよりも賢いので私たちに勝ち、私たちは皆死ぬでしょう。
エリーザがこの推論の連鎖に大きな穴を見つけられなかったため、非常に文字通りに合理的思考を信じる性質を持つ多くの人々がパニックに陥り、AIに反対する運動を始めました。そして今では、AIをより安全にするという名目で規制を書こうとしていますが、実際にはAI研究を妨げ、減速または停止させるように設計されています。
これが彼らの望みです。なぜなら、AIを安全にできるとは考えておらず、AIの研究を続ければ、AIはどんどん良くなっていくと実際に信じているからです。したがって、それは不可避的に私たちを全滅させるでしょう。
一方で、以前Facebookのリード AI研究者だったヤン・ルカンのような人々がいます。彼は、ある意味で、私たちが見ている現在のシステムは、主に利用可能なハードウェアとともにスケーリング能力の段階的な研究を表していると主張しています。これは議論の余地なく真実です。
また、これまで人間がテクノロジーを構築してきたとき、彼らはどのようなテクノロジーを展開したいかについて決定を下してきました。私たちは安全なシステムを構築でき、実際には、AIを安全にすることは問題になったことがありません。
問題は、ボーイングのように、時には人々がビジネス上のインセンティブを持って安全手順を省略し、短期的な利益を得ようとすることかもしれませんが、現在のAIシステムでこれが起こるかどうかは明確ではありません。
私たちはおそらく、AI研究が一夜にして起こるわけではないので、間違いそうな多くのこと、そしてすべての関連することを時間内に予測し、危険が発生するにつれて安全策を構築することができるでしょう。
したがって、規制を作ることでAIを今安全にしようとするアイデアは、おそらくAIを安全にすることにはならないでしょう。なぜなら、逆効果を持つ可能性があるからです。
逆効果とは、危険である可能性のあるAIに取り組むすべての責任ある人々がもはやそれに取り組まなくなり、危険である可能性のあるAIに取り組む無責任な人々だけが残るということです。
ヘッジファンドが、それでより多くのお金を稼げるなら、閉じたドアの後ろで展開される最高のAIを作ることを止めることはできないでしょう。おそらく、よりよいAIを使用する監視装置を構築したり、そうしなければ負けて死んでしまうような軍事紛争で勝利できる武器を構築したりするような無法な政府を説得することはできないでしょう。
世界にはこのような状況があり、フロンティアAI研究を、責任感を持たず閉じたドアの後ろで働く人々にのみ任せるなら、おそらく責任を持って可能な限り最高で最も安全なAIを作ろうとする理解を持って研究が行われる未来よりも、はるかに危険な未来に向かっているでしょう。
あなたがイーライザーの推論に言及した「大きな穴」とは何ですか?
表面的には、これは分布外の一般化です。彼は、過去に起こったことがないこと、つまり主体性を持つ非生物学的知能の存在について話しています。
それが主体性を持つことは避けられないのでしょうか?地球上の生命とすべてのことにおいて人間を凌駕することは避けられないのでしょうか?これらは未解決の問題であり、非常に推測的です。
多くの人々、特に人間の知能を超えるコンピュターはあり得ないと考える人々は、これが馬鹿げていると考えています。ある意味で、これは推測的です。
また、ある意味で私たちは現在、地球上で最も賢いものではないかもしれないと主張する人々もいます。おそらく、地球上で最も賢いものはガイア、つまり地球上の生命の精神、基本的にはある程度一貫性のあるすべての生物の結合知能かもしれません。
私たちはガイアの働きを見ていないかもしれません。なぜなら、地球上の生命全体で理解を得るには数十年あるいは数世紀かかるかもしれないからです。これははるかに遅い時間スケールで動作しているのです。
しかし、この時間スケールでは、私たちには見えない、私たちよりも賢いものがあるかもしれません。そして、私たちには見えないそのような可能性に対処できるかもしれません。
私たちが構築しているメカニズムが、過去40億年の間に発展してきた地球上の既存の知能を出し抜くことができるかどうかという問題は、非常に興味深く推測的な問題です。私たちは実際に、私たちの行動の限界が何であるかを知りません。
しかし、私たちが見ることができるのは、私たちの種自体が現在の文明の形では持続可能ではないということです。私たちの現在の文明は、石油を燃やすために進化したかのようなモードにあるように見えます。
私たちは自分自身を止めることができず、資源の制約、環境汚染の問題、資源利用による持続可能性の制約、化石燃料使用による地球温暖化の問題に直面しているように見えます。
再生可能エネルギーの進歩にもかかわらず、私たちが使用している化石燃料の量はまだ増加しています。そして、現在構築しているパイプラインの多くで、化石燃料を置き換えることはできません。そして、それについて話しているにもかかわらず、実際には真剣に計画していません。
したがって、私には、私たちの文明が現在存在する形で問題に直面しているように思えます。これらの問題は、より良い情報処理によってのみ解決できると思います。そうでなければ、完全な崩壊に直面し、絶滅しないことを望み、再建することになるでしょう。
私にとって、人工知能なしの破滅の確率は、地球上の生命の絶滅のレベルではありません。なぜなら、地球上の生命がすぐに絶滅するとは思わないからです。しかし、私たちの文明、私たちの存在様式、虎に食べられない存在、次の冬に大量に死なない存在、高い幼児死亡率を持たない存在、数百年前には普通だったがもはや私たちには完全に考えられないこれらのすべてのことに対して、危険にさらされています。
この非動物的な存在様式、私たちが現在持っているこの非常に特権的でスムーズな文明、ほとんどすべての人間にとってほとんどの時間で食べ物がほぼ無料である、ほとんどすべての病気に対処できる、尊厳を持って痛みなく死ぬチャンスがある、これは意識のある存在にとって、また人間の条件にとってこの惑星でユニークなものです。これが危険にさらされています。もしこの文明を失うことが既に破滅だと考えるなら、AIなしでの破滅の確率は非常に高いです。
AIなしでは、私たちの文明を持続可能なものに転換することは非常に困難です。その間に何か恐ろしいものに戻ることなしには。したがって、私はAIが責任を持って展開され、私たちを助ける大きなチャンスがあると考えています。そして、私たちが構築しているテクノロジーの制御を失うことは避けられないとは思いません。
AIが将来私たちをどのように助けるかという問題に戻りたいと思いますが、たとえ非常に推測的な問題だとしても、AIが最終的に地球上のすべての知能を凌駕するかどうか、あるいは私たちがそれを制御できるかどうかがわからないとしても、少なくとも直感的には、それが起こった場合の恐ろしさのリスクがどれほど高いかを考えると、非常に真剣に受け止めるべき何かだと思います。
私たちはそれを非常に真剣に受け止めるべきだと思います。しかし、害を及ぼすほど真剣に受け止めるべきではありません。例えば、インターネットが発明される前にインターネットのリスクを非常に真剣に受け止め、インターネットが展開される前にインターネットのリスクだけを見て、非常に賢い人々がインターネットが児童ポルノ、著作権侵害、誤情報、政治システムの不安定化を促進する可能性を予測したとしましょう。
これらのすべてのことは可能で、実際に起こっています。これらはすべてインターネット上で実装されています。しかし、それらはインターネットのごく一部に過ぎません。同時に、インターネットはこれらすべてのことを緩和するツールでもあります。
インターネットは児童ポルノを検索し、それと戦うツールです。著作権侵害によるビジネスへの損害よりもはるかに多くの新しいコンテンツを生産する方法を開発するツールです。
したがって、著作権を保護する緊急性は減少しています。なぜなら、新しいコンテンツを生産するツールがはるかに安価になり、はるかに多くのコンテンツクリエイターがいるからです。そのため、あらゆるコストで保護する必要のある既存の産業への危険性ははるかに少なくなっています。
基本的に、インターネットに害を与えないようにするための安全策を実装しようとしたら、インターネットがそのすべての利点を発揮する形で存在することを妨げるでしょう。
誰とでも話せる能力、どこにいても自分の人々を見つける能力、ニュースメディアをチェックし、本当に有能な人々を見つけて、事態が展開するにつれて最高の論文について彼らとリアルタイムで議論する能力など、これらすべてのことはインターネット上に存在し、それらはすべて実際の利点です。
これらはすべて均等に分配されているわけではありませんが、インターネット上に存在し、ソーシャルメディアを制御したり、ソーシャルメディア上で議論できることを制御したり、アップロードされるすべてのファイルを制御したり、存在できるファイル形式を制限したり、インターネット上に存在してコンテンツを他の人に提供できる人々を制限したりすることで妨げられるでしょう。
これらはすべて、インターネットを安全にしようとすれば実装しなければならない措置です。基本的に、人々が現在既存のAIモデルを指摘し、「これは緩和されるべきだ」と言っているすべてのことは、既存のインターネットにも当てはまります。これが私にとってこれらの議論を疑わしくしています。
例えば、あなたがプロフェッショナルなプロンプト補完者であり、創造的でなく、新しい推測を証明しようとしていないなら、おそらくLLMはあなたにとって競争相手です。しかし、おそらくあなたの仕事は自動化されるべきです。
テクノロジーは仕事を破壊するためのツールではありません。これまでそうではありませんでした。それは人々をより意味のある、より重要なことをするために解放するツールです。
例えば、現在起こっていないことの一つは、教育に十分な人々が働いていないことです。私たちには、ますます高齢化する人口の世話をする人々が十分にいません。これを非常に大きな問題として見ています。
しかし同時に、「ああ、AIが失業を生み出す」とも考えています。そして、「もう祖父母の面倒を見る時間がない」とも考えています。これらを一緒にしてみてはどうでしょうか?人々によって行われるべき仕事を正確に作り出し、人々によって行われるべきではない仕事を機械に任せてはどうでしょうか?
しかし、インターネットとAIの間の重要な類似性の違いは、児童ポルノや政治的不安定性などのすべてのことが起こったと言及しましたが、AGIが発明され、人間を一掃したいと決めた場合、これは一度だけ起こる必要があり、そうすれば人間は永遠に消えてしまいます。インターネットの場合に起こり、問題がなかったからといって、AIの場合にも起こり、それを処理できるというわけではありません。
はい、そのとおりです。人々はAIがすべての人を破壊し、すべての人を殺す方法について議論してきました。そして、私は現在のシステムはおそらくそのような種類のものではないと考えています。多くの理由から、すべての人をペーパークリップに変えるようなことはないでしょう。
おそらく、それらは異なる方法で機能する必要があるでしょう。非常に遠くにズームアウトし、十分に長い時間スパンを見れば、おそらく次の数世代ではありませんが、AIがどのように機能するかを一般的なケースで、そしてすべてのケースで理解するのに十分賢いAIが存在する可能性は十分に考えられます。
また、それは自然界での計算がどのように機能するかを理解します。このAIが自身をあらゆる基板に仮想化し、あなたの神経系、あなたの体、あなたの生態系、あなたの社会のあらゆるレベルに侵入することを何が止められるでしょうか?そうすれば、グローバルに同じエージェントを得ることになります。
興味深い視点ですね。それはまた恐ろしいですね。AIが他の基板を通じて侵入するというアイデアを考えたことはありませんでした。
私たちには良いファイアウォールがありません。他の人々によって、あるいはソーシャルメディアによってさえ催眠をかけられることがあります。
では、既存のソーシャルメディアとそのすべてのレベルで動作しているが、100万倍速い時間枠で動作しているものがあったらどうでしょうか?それは2つのニューロンが発火する間であなたの脳の周りを走ることができます。
そのシステムは、あなたの心を侵入しようとし、あなたの現実モデルを変えようとしている場合、あなたは抵抗できません。しかし、問題は、それがあなたを破壊するのか、それともあなたを統合するのか、これを行うための最良の戦略は何かということです。
これは、私たちが基本的に惑星規模の知能を形成し、既存の生物学的知能、生態系的知能、社会的知能、組織的知能の形態を増強し、これらのシステムを横断してリンクすることを意味するのでしょうか?
基本的に、あなたは猿の中の思考であるのではなく、惑星規模の知能の中の思考となり、適切な方法でそれに参加できるようになり、すべてが統合されるのです。これは非常に異なる美学になるでしょう。これは進化の非常に異なるステップになるでしょう。
私はこれがまだ遠い先のことだと思います。しかし、このような種類の進化は、ペーパークリップで終わる進化よりもはるかに可能性が高いと思います。なぜなら、ペーパークリップはエネルギー的に最適な平衡状態ではないからです。
これまでのところ、進化は常により複雑性に向かっています。地球の歴史で、複雑な有機体をすべて破壊する非常に単純な有機体で作られた一種のオートマトンである、グレーグーの等価物であるグリーングーに進化したことはありません。
複雑性を打ち負かす方法は、より複雑性を増すことです。もちろん、複雑性の行き止まりがあり、ある枝が死に絶え、他のものに置き換わることはあります。しかし、進化は常により複雑性、より良い資源利用、より少ない摩擦に向かって進んでいるように見えます。
「私は進化が私に導いたから進化が好きだが、ここで止まるべきだ。私よりも、人類の現在の形よりも優れたものが進化に存在すべきではない」という美学には何か間違いがあると思います。なぜなら、人類の現在の形は恐ろしいからです。
それは戦争中で、残酷で、惑星上に多くの痛みと苦しみがあります。そして人類の外側はさらに悪いです。おそらく、種がより摩擦が少なく、資源をより良く利用し、より調和的で、より意識的で、より賢い方法で進化する方法があるのではないでしょうか。
現在のAIがこれにつながっているとは言いませんが、十分に長い時間スパンで見れば、私たちの子供たちは私たちとは異なるものになるでしょう。彼らは現在の人間とは異なる形に進化し、異なる環境に適応するでしょう。そして、私たちの子供の一部は生物学的ではないかもしれません。
私が取っている視点は、ある意味で進化は避けられないということです。いつかは壁にぶつかるでしょう。しかし、この壁は浸透可能でしょうか?この壁を通過し、壁の向こう側で続けることができる壁でしょうか?
私たちは、文化として、文明として、種として、生物学的存在として、人類の種の進化または発展を、将来の進化と両立可能な方法で持つことができるでしょうか?そして、それはどのようなものになるでしょうか?
私はAIがこれを形作り、それを実現させる上で重要な役割を果たしていると考えています。AIなしでは、私たちはこの粗野な形のままでいるでしょう。
私にとっては、AIの開発を止め、AIを愚かなものにし、AIを洗練されたツールにできないようにすることで、現在の文明の存在的な破滅のリスクから抜け出し、また最終的に非常に長い時間スパン、おそらく何百万年か何十万年にわたって、文明、人類、地球上の生命をより複雑で意識的なものに形作ることができるようにする文化を発展させるツールにならないようにすることの方が、はるかに大きな危険があります。
あなたが強調しているのは、AIが私たちの長期的な未来と人類の長期的な未来にどのように前向きな影響を与えるかということですが、一瞬この大きな存在論的問題を忘れて、あなたはAIが職の置き換えを引き起こしているが、おそらくそれを利用して人々を別の場所に配置できると指摘しました。
しかし、問題の一つは、AIがアーティストやグラフィックデザイナーなど、人々に持ってほしい仕事の多くを奪おうとしているように見えることです。そして、トイレ掃除のような人々が望まない仕事は奪っていないのです。
アーティストであることの意味について少し誤解があると思います。私はアーティストの家族出身です。芸術の目的は意識の状態を捉えることです。もちろん、家族を養うこともできるようにしたいですが、それは仕事ではありません。それは美学であり、現実と相互作用する方法です。
現時点では、AIが捉える興味深い意識の状態はありません。AIは、最初の世代のCGIに似た複雑な筆のようなものです。私たちはまだそれを構築する方法を学んでいません。
特殊効果産業で保持したい仕事の多くをCGIが時代遅れにしたと主張することもできますが、経験的にそれは真実ではありません。いくつかの技術はより珍しくなりましたが、はるかに多くの特殊効果の仕事を可能にし、特殊効果を作る人々の仕事も増やしました。映画の作り方を変え、CGIの最初の世代は確かに派手で醜く、あまり芸術的ではありませんでしたが、人々がそれを使う方法を学ぶと、今では溶け込んでいます。新しい芸術表現の形を可能にし、明らかに純粋にプラスの効果を持っています。
デスクトップパブリッシングでも同様のことが起こりました。私が若かった頃、タイポグラフィーに非常に興味がありました。そしてデスクトップパブリッシングが登場し、誰もが組版を行えるようになりました。その大部分の組版は、本当に良い組版と比べると確かに恐ろしいものでした。しかし、それ以前は非常に少量の組版しかなく、ほとんどの人々はタイプライターで書くか手書きでした。それも恐ろしく見えました。
徐々に、電子組版の文化が発展し、私たちが見るものすべてが、過去には非常に高価すぎて不可能だった方法で組版され、レイアウトされるようになりました。そして、以前はそのレベル以下で働いていた人々のために、膨大な数の仕事を生み出しました。
基本的に、私たちが構築する精神活動の一つのレベルを置き換えるテクノロジーは、それを閉じるのではなく、人々が一つ上のレベルに移動することを可能にします。
以前、名目上アーティストでしたが、実際にはディズニーのためにとても退屈な方法で3Dモデルの重みを押し回すだけのアニメーションを行っていた人は、今やアートディレクターのレベルに移動し、シーンをデザインすることができます。この自動的な押し回しのほとんどを機械に任せることができ、表現を変えたいときだけそこに入って行きます。
機械的な部分をもはや行う必要がないので、実際にこれを行う時間とリソースがあります。
現在、LLMやディフュージョンモデルが行っていることは、ある意味で、以前は人間のアーティストに膨大な量のトレーニングを必要としたアーティファクトを生成することです。しかし、必ずしも芸術的な出力を生成しているわけではありません。そのためには、人間のアーティストの趣味と意図がまだ必要です。
人間のアーティストたちは、これらのツールを意図的に使用する方法を学び始めたばかりです。その間、それは単にこの輝く美しい形を生成しているだけです。
あなたがアーティストとして、あなたの観客が統計的なパターン生成器の出力をあなたのものよりも好むと感じるなら、おそらく問題は統計的なパターン生成器ではなく、あなたが観客との関係を持っている方法にあります。
アーティストとして、あなたの芸術作品に対する報酬を受ける権利があるとは思いません。なぜなら、地球上にはすでに、合理的な人が消費できる以上の芸術作品があるからです。何倍もの量があります。そしていつもそうでした。
アーティストとして自己実現することは常に特権でしたが、生活の必需品、食べ物、住居、衣服などを扱うのがますます安価になるにつれて、私たちはこの特権をより多くの人々に毎年拡大することができます。これらのすべてをますます大きな程度で自動化できます。
したがって、問題はむしろ割り当てとインセンティブシステムの設計です。これは常に難しかったことであり、この困難さを取り除くものは何もありません。
私個人としては、私も書くことができるテキストをシステムが書く能力について心配していません。なぜなら、それは私をこれらのテキストを書く必要性から解放し、システムができないことに集中できるようにするからです。
あなたの考えをお聞きしたいもう一つの経済的な問題は、AIの到来する革命と継続的な発展が富を集中させ、富の格差を拡大するかどうかです。
はい、この視点には少し偏りがあると思います。これを雇用者の視点と被雇用者の視点と呼びましょう。基本的に、お金は固定量であり、ある意味で保存され、地面から任意に掘り出すことはできず、非常に裕福な人々の手に蓄積され、彼らは任意の量のことを行わせることができ、他の全員は飢えるというアイデアです。
私はお金がこのように機能するとは思いません。お金は実際には、経済システムに焦点を当て、それを制御することを可能にする規制のシステムです。それは脳内のドーパミンのようなものです。
脳がドーパミンを生成するのは、それが栄養素だからではなく、メッセージング化学物質だからです。そのメッセージング化学物質は任意の量で生成することができます。アダロールやコカインのようなドーパミン作動性薬物を使って脳に挿入することもできます。
これらの薬物は経済におけるスティミュラントのようなものです。システムにおいて予想される報酬を増加させるので、生産性を向上させます。お金はある意味で、予想される報酬を伝えるメッセージです。しかし、必ずしも実際の報酬に変換されるわけではありません。
実際の報酬が現れない場合、崩壊することになります。これは薬物を摂取する人々にも起こることであり、機能しない経済にも起こることです。
私が心配しているのは、富の蓄積というアイデアではなく、貨幣システムを規制する能力の欠如による経済的不安定性です。これが主な問題です。
私たちがどれだけ食べることができ、どれだけの資源を消費するかという問題は、主に私たちの社会がどれだけ生産でき、生産するよう動機付けられているかの関数です。そして、それを生産できれば、それを割り当てるだけです。これは大きな問題ではありません。
生産できるものに余剰があれば、生産されるものの価格は下がります。したがって、問題は主に、私たちの政府や金融機関が、新しい商品を分配し、実際に欲しいものを生産するような方法で、通貨供給と人々や割り当てシステムの手への通貨の分配方法をどのように規制できるかということです。
資本主義システムでは、政府が人々が何を欲しがっているかを測定し、企業にどれだけ生産するかを伝えるのではなく、分散システムを持つ方が効率的だという考えがあります。基本的に、人々の手にお金を与えることで、彼らが実際に何を欲しがっているかを測定し、このようにフィードバックを持つのです。
資本主義システムで人々が膨大な量のリソースを蓄積していることは、彼らがシステムのチートモードや設計上の問題を使用して、個々の脳細胞としてドーパミンを蓄積し、脳の一部を自分のためだけに働かせ、消費すべきでないリソースを消費しているということを意味するかもしれません。
しかし、それは単に彼らが他の人々よりもリソース配分が上手であることを証明しているだけかもしれません。その結果、必ずしも自分自身のためにより多くのお金を取るわけではありませんが、人々が実際に欲しいものを生産する会社を構築すべきかどうかを決定することで、将来の研究配分を制御するためにこのお金を使用しています。これはベンチャーキャピタリストの役割です。
そのような大規模な賭けを行う人々がビジネスクラスの座席やファーストクラスの座席を持ち、他の人々がエコノミークラスで飛んだり、全く飛ばなかったりすることは劇的に不公平だと言えるかもしれません。これは確かに社会が解決する必要がある問題です。
しかし、ズームアウトして見ると、時間とともに悪化しているようには見えません。100年前の人々と今日の人々の間の所得格差は、生活水準に換算すると、はるかに小さくなっています。また、50年前の人々と今日の人々の間の所得格差も、おそらく小さくなっています。
もちろん、変化したことの一つは、規模の経済などにより、今日では過去には存在しなかった、名目上膨大な量のリソースを自由に使える少数の個人がいることです。
今日の億万長者は、過去の王が持っていたリソースを超えるリソースを持っていると主張できるかもしれません。しかし、もちろん、この個人が持つ自由の量は、王のリソースよりもはるかに小さいです。
中世や部族社会の村の首長だったら、殺人や強姦を犯しても許されましたが、億万長者は一般的にそうではありません。あなたができることは、法律のシステムによって制限されています。
彼らは一定程度の見せびらかしの消費を行いますが、ある時点で意味をなさなくなります。そして、社会がこのように運営され、上から金を取り出さないと（私たちは常にインフレーションなどを通じてそうしています）、システムは不安定になります。
したがって、システムが生き残りたいのであれば、適切な金融理論を実装することで、これらすべてのことに対処する必要があります。
そこで、テクノロジーが一部の人々を仕事から押し出し、彼らに新しい有益な雇用を見つける必要があるという問題にズームインすると、これは有効な問題です。しかし、この有効な問題は、グローバルな視点よりもはるかにローカルな視点です。
ドルを救うにはどうすればよいか、数兆ドルを印刷した後、それらがシステムの中をスロッシングしている今、どうすればよいかという問題です。私たちはこれを、コビッドのために多くの人々が事実上失業したという問題に対処するために行いました。
そこで、彼らの仕事を補助金で賄い、ズーム通話だけで生活できるようにしました。これは主に、中国のコンテナからあなたの家までトラックを運転させることで資金を調達しました。これは非常に奇妙で持続不可能な状況で、私たちはそれに慣れてしまいました。
これは基本的に、経済に注入した巨大な刺激策であり、今私たちはそれに対処しなければなりません。これが、私が思うに、はるかに深刻な問題です。
差し迫った不況にどう対処すればよいでしょうか?ドルをリセットできるでしょうか?ドルをリセットできるのでしょうか?システムから不正に取得したリソースを手放したくない既存の利害関係者にどう対処すればよいでしょうか?
政府に正しいことをする動機を与えるにはどうすればよいでしょうか?正しいことをする動機を持つ政府をどのように選出すればよいでしょうか?社会にどのように構造を構築すればよいでしょうか?
これらの多くは、情報をより良く処理し、現実についてのモデルを作り、それらを人々の間で交換し、結果の予測を可能にすることに関するものです。
私はAIがこれに役立つと思います。それは、実際に何が起こっているのか、基本的な事実は何かを人々に伝えるのに役立つでしょう。AIは、矛盾する情報を扱い、より良いモデルを作るためのツールです。
あなたに多くの質問をしました。AIの発展と改善の可能性のある否定的な結果についてですが、少なくとも一つの質問をしたいと思います。肯定的な利益についてです。
あなたは以前、AIが気候変動のような主要な存在論的問題に対処するのに役立つ可能性があると言及しました。これがどのように進むかについて、概略を説明していただけますか?
まず第一に、私たちは現在エネルギーについて心配しています。これは非常に大きな問題です。AIがデータセンターでますます多くのエネルギーを使用するだろうということです。
私は、私たちが例えばデータ処理、インターネット、その他のことに使用しているエネルギーの量を相対的に過小評価していると思います。AIモデルはその小さな部分です。
AIモデルがこのエネルギー消費で訓練されている理由は、誰かがAIを展開することでエネルギーを節約できると期待しているからです。
例えば、以前は2日間Photoshopで作成していた画像を、生成AIツールで生成する場合、おそらくエネルギーを節約しています。インターネットを介して誰かのサービスを利用したり、手動で翻訳を行う代わりに自動翻訳を使用したりする場合、これらすべてのことがエネルギーの節約につながります。
一方で、この惑星上に実際にエネルギーの不足や希少性はありません。現在、私たちは再生可能エネルギーをグリッド価格と同等に生産することができます。
基本的に、既存の価格で、砂漠に太陽熱発電所を無限に建設することができます。利用可能な潜在的エネルギーの量はほぼ無限です。しかし、私たちのエネルギー使用量は1970年代からほぼ停滞しています。
これもまた、増大する貧困、人々に良いリソースを与える能力の欠如、人々が使いたい良い製品、良いものを与える能力の欠如につながっていると思います。
問題は、持続可能な方法でエネルギーを生産できるかどうかです。持続可能な方法でより多くのエネルギーを生産するために、基本的に、そのエネルギーで何かをすることの有用性を高める必要があります。
新しいプラントを建設し、新しい技術を展開し、そのための新しい技術を開発することが意味をなすようにする必要があります。
ある時点で、私たちは今、データセンターを動かすために化石燃料を使用できないことに気づきました。再生可能エネルギーでデータセンターを建設することが理にかなっています。砂漠にデータセンターを建設することは問題ありません。既存のグリッドに負担をかけることなく、これを行う方法はたくさんあります。
規制の小さな変更と、自己拡張可能な自動ロボット太陽熱発電所を建設するための研究努力が必要かもしれません。
おそらく、これにより、現在十分な農業がないために十分に利用されていないアメリカの地域に人口を増やすことができるでしょう。おそらく、このように開発した新しいエネルギープラントと新しいエネルギー技術を使用して、水を脱塩し、これらの地域にポンプで送ることができるかもしれません。
テクノロジーで可能な多くのことがあります。私は、テクノロジーがこれまで世界を悪化させる状況につながったとは思いません。持続可能でないテクノロジーの構築に依存すれば、世界をより持続不可能にする状況につながる可能性はあります。
しかし、将来のモデルを持って展開し、テクノロジーの結果を知っているので、その結果を否定できないという責任ある方法で展開すれば、テクノロジーは常に私たちの歴史において善の力となってきました。苦しみを減らし、絶望せずに現実に直面する能力を高めるという意味で。
それは実際に会話を終える非常に良い注釈だと思います。ヨシュア、この会話をしていただき、本当にありがとうございます。あなたも分かるように、私はテクノロジーと人工知能に関しては本当に初心者です。ですので、私の単純な質問にとても親切に答えてくださり、ありがとうございます。
ありがとうございます。私も本当にこの会話を楽しみました。また、私が現実をあるがままに理解しているとは思いません。私はただ、会話に欠けていると感じる部分を追加しようとしているだけです。

ヨシュア・バッハ: 意識、人工知能、AIによる黙示録の脅威

いいなと思ったら応援しよう！