ChatGPTの解説です。
公開日:2023年4月22日
※動画を再生してから、インタビューを読むのがオススメです。
だから、ChatGPTの前に、生徒たちに「マノリは今、何を言っているんだろう」と聞いていたんです。
皆さんは今、私の良いエミュレーターを持っていますね。
ラバーダックリングというプログラミングのパラダイムをご存じでしょうか、そこに座っているラバーダックリングに、自分のコードで何をしたのか、なぜバグがあるのかを説明するのです。
そうすれば、説明することで、なんとなくわかってくるものです。
ある朝、私は夢から目覚めました。円形劇場で講義をしていて、友人の一人が、がんゲノムやがん細胞がどのように進化していくかについて、進化論的な深い洞察を私に教えてくれるのです。
そして私は、私が行っていた非常に精巧な議論と、彼が持っていた非常に精巧な洞察のセットを、寝ている間に友人に投影している状態で目を覚ましました。
これは明らかに私の夢でしたから、私自身のニューロンにはその能力がありました。
しかし、「あなたは今、ピユシュ・グプタで、がんゲノム学の教授で、その分野の専門家です、何を言っているのですか?
私たちは皆、自分の中にそういう能力を持っていて、「何が正しいかわからないけど、仮想の元恋人に聞いてみよう、あなたならどうする?」
そして、バーチャル元彼は、「親切にしなさい」と言うのですが、私は、「ああ、そうだな」と思いました。
そして、私自身は促されないとできないかもしれないけれど、私の好きな促しは、ステップバイステップで考えることです。
そして、これは私の10歳の子どもにも効果があるんです。
彼が数学の方程式を一通り解こうとしたとき、私はあなたがどんな間違いをするのかよく分かっています。
でも、「一歩ずつ考えてね」と促すと、ある種のマインドセットになるんです。
ChatGPTが実際に訓練された方法の一部だと思いますが、ループ内の人間による強化学習によって、この種の行動が強化されたのでしょう。このフィードバックループがあることで、人間による促しの機会に対してAIをよりうまく合わせることができるのです。
そう、人間による推論のステップや、段階的な思考のようなものを促すのです。
でも、これは私たち自身の能力を映し出す鏡のようなものだと思います。
だからこそ、私たち自身の認知能力に本当に感銘を受けることができます。なぜなら、普段私たちはPythonコードを使って自分の心を厳密に操作することはできないので、試すことができるバリエーションは限られているからですよね。
そうです。
だから、人間の知恵や知識、少なくとも指先の知識で遊ぶことができ、さらに、あらゆる方法で考えたり話したりできる小さな心を弄ぶことができるのです。
ユニークなのは、先ほど述べたように、私たち一人ひとりが、人類の文化の異なる部分集合によって訓練されたことです。
そして、ChatGPTはその全てに訓練を受けています。
そして、そこでの違いは、おそらく私たちのほとんどすべてを模倣する能力を持っているということです。
認知行動空間において、いくつかのプロンプトを出すだけで、それがどこにあるのかがわかるというのは、とても印象的です。
しかし、それがどこかに存在するという事実は、非常に美しいものです。
そして、それが知識とは直交する形で符号化されているという事実も、私は美しいと思います。
AIモデルの極端なオーバーパラメーター化によって、コンテキスト、知識、フォームが分離可能であることを理解することができたのです。
そして、科学的な知識を俳句の中で、シェイクスピアか何かの形で表現することができるのです。
このことは、人間の精神のこの種の側面の分離と分離可能性について、何かを物語っています。
そして、それがこの全体の科学の一部なのです。
ですから、これらの大規模な言語モデルは、このような飛躍を遂げたという点では、何日も前のものなのです。
文脈、形式、知識の分離について、このような分析をするのは興味深いことです。
それはいったいどこで起こるのでしょうか?
すでに初期調査のようなものは行われていますが、その場所を特定するのは非常に困難です。
特定の知識、特定の文脈、特定の話し方には、特定のパラメータのセットが必要なのでしょうか?
そのため、畳み込みニューラルネットワークでは、解釈のしやすさが格段に向上しました。
ニューラルネットワークには構造があります。
局所性がある。
また、異なるレイヤーを理解することができ、そのレイヤーが見ている範囲の違いも理解できます。
そのため、活性化の特徴を見て、それがどこに対応しているのかを確認することができます。
大規模な言語モデルの場合は、もう少し複雑ですが、「このモデルはどのようなプロンプトを生成するか?
ネットワークのこの部分を削除したら、どうなるのか?
そして、人間の行動や心理のこのような側面を記述するための言語を、音声部分から言語部分へと広げていくことができるのです。
そして、その利点は、実際に人間について何かを教えてくれるかもしれないということです。
私たちは今、このような側面を表現する言葉を持っていないかもしれません。
しかし、誰かが特定の方法で話すと、あちらこちらで知り合った友人を思い出すかもしれません。
もし、それを説明するためのより良い言葉があれば、こうした概念は私たち自身の人間心理の中でより明白になるかもしれません。
そして、その概念を機械にうまく組み込むことができるようになるかもしれません。
つまり、しかし、おそらくあなたと私は、ベースモデルは、人間のフィードバックと強化学習の整合性の前であり、モデルのAIの安全ベースの一種の検閲の前であるベースモデルとしてエコーを開くだろうとの特定の関心を持っています。