見出し画像

ケンタウロス: 人間の認知に関する最初の基盤モデル

9,330 文字

ああ、すごい写真だ。トランプ大統領就任式でのベゾス、ピチャイ、マスクの写真。HRTを摂取しているベゾスが2人の間に入って調停役を務めているのは良いことだ。
投資家を探しているなら、LinkedInで実際の投資家1,000人がどのように交流しているかをAIでシミュレーションしたものがある。
触手のあるドローンが現実のものになった。実際にはAIの触手が登場してきている。あるいは動き方からすると象の鼻に近いかもしれない。
就任式では起こらなかったので、AIが億万長者たちのボクシングの試合をシミュレーションすることにした。ニューラルリンクのような技術のおかげで、両者は予想以上に互角の戦いを繰り広げた。
ニューラルリンク技術のおかげで、麻痺した男性が精神だけでバーチャルドローンを操縦できるようになった。AIは動物同士のコミュニケーション方法について新たな洞察を与えてくれている。
イギリス政府が導入したものを聞いたら驚くよ。それはAIで、名前はハンフリーだ。世界で初めての人間の認知に関する基盤モデルが登場した。新しいAIアーキテクトは、人間の脳活動を5秒前から99.7%の精度で予測できる。本質的に前犯罪探知機だ。
サラ・マークスの未来の殺人容疑で逮捕する。その男の頭を渡せ。誰もそうは呼んでいないが、ちょっと考えてみよう。
Soraの動画を見ていて、実際のトレーニングで現実世界の物理法則を学習したのか、それとも2次元の形状から物理法則をシミュレーションしているだけなのか気になっていた。研究者たちが調べてみて、興味深い発見があった。
私のPatreonの購読者の1人がこの動画を送ってきた。GPT-5に健康な腸内細菌を与えたらAGIが実現するかもしれない。人類は鉛によって集団的に2.6 IQポイントを失った。これ以上失うわけにはいかない。私のIQを奪わないでくれ。グリムロック、私グリムロックは強い、グリムロックは戦わなければならない。
テック評論では、新しいソーシャルネットワークのBlue Skyが他のものとは全く異なる理由を説明している。そしてGPT-5について面白い噂がある。噂が飛び交っている。また、patreon.com/Dillancuriousでは、このチャンネルをサポートする素晴らしい方法があるという噂もある。
あなたは私グリムロックをサポートする。基本的に私と想像上の友人たちが、何十億年の生命の歴史の中で初めて知性を発明しているこの世界を乗り切るための未来主義的なコンテンツを作っている。
まずはソーシャルメディアを所有するこれらのテック億万長者たちについて話そう。トランプがアラインメント問題を解決したのか?ベゾス、スンダル・ピチャイ、マーク・ザッカーバーグ、イーロンを結束させた唯一の人物だ。彼らがこのように一緒に写真に写ったことはあるのか?すごいことだ。正直に言うと、もはやティム・クックはそこにいる必要はない。
資金調達をしようと思っていて、1,000人のベンチャーキャピタリストがLinkedInでどのように交流しているのか気になっていた人なら、ぴったりのビジュアルがある。これが私がピッチする前の投資家たちだ。サファイアベンチャーズ、HSBC銀行、さらにプレクソキャピタルもここにいる。
そして私は彼らに、私の会社は大規模言語モデルを組み込んだロボット恐竜を作っていると伝えた。ターゲット層はアスペルガーを持つオタクで、私たちはシミュレーションを...ああ、5分かかりそうだ。次の記事の後で戻ってこよう。
AIと触手学習のおかげで、触手のあるドローンが現実のものになった。ボールをつかめると思うか?バケツをつかむことができる。象の鼻のように見えないか?物をつかんで巻きつく様子がとても有機的だ。4つの触手が協力して、さまざまな大きさや形の物体を持ち上げている。シミュレーション環境に入れて、アリを優しく拾えるようになるまで訓練することもできる。
感情スコアは43しかない。これらのドットの9%からお金を得られれば...ああ、私たちは作っているんだ。
残念ながら、私のピッチは好意的に受け取られなかった。大規模言語モデルを搭載したロボット恐竜のコンセプトは面白いが、ニッチすぎると多くの投資家が感じた。ハードウェア市場規模について懸念が示された。そうだね、でも恐竜が好きな人はたくさんいるし、「アスペルガーを持つオタク」というターゲット層は狭すぎると見なされた。
何が気に障ったというの?ああ、そうだね、ちょっと気に障ったかもしれない。じゃあもう一度試してみよう。今度はただのオタクで。その間に、世界で最も裕福な2人のAIによるボクシングの試合を見ることができる。
ザッカーバーグとイーロン・マスクだ。就任式の後、AIは彼らを洞窟に入れることにした。本物の試合を待つ必要はない。AIの動画で予測を見ることができる。かなり互角の戦いのようだ。イーロンは多くの攻撃をうまくブロックしている。2人とも顔を激しく打ち合っている。イーロンはザックよりも多くのテクノロジーを戦いに持ち込んでいる。何か超パワフルな手袋のようなものだ。
ああ、顔に当たったが、2人とも倒れた。そのような力を扱うのは難しい。アーノルド・シュワルツェネッガーが楽しんでいる様子だ。そして最後には2人ともウィル・スミスに負けた。なんという展開だ。
改良したピッチで大きな違いが出た。肯定的な反応が14%に上がり、注目度も上がった。いくつかの推奨事項がある。「オタク」をもっと広い用語、例えば「家族」や「教育現場」に置き換えることを提案している。「子供たちに歴史を教えることができる等身大のロボット恐竜を想像してください」と言うことを推奨している。このサイズのものを作って子供に売るとでも思っているのか?
麻痺していても、必ずしもドローンのパイロットになれないわけではない。脳インプラントを持つこの男性は、指を動かすことを想像した。麻痺しているため実際には指は動かないが、その信号が仮想環境に送られ、望む通りにドローンを制御した。
これは臨床試験の一部で、ブレイン・トゥ・ゲートと呼ばれている。麻痺を持つ人々が脳信号を使ってデバイスを制御できるようにすることを目的としている。これがブレイクスルーとなったのは、インプラントが個々の指のグループを解読し、予想以上の精度で障害物コースを通じてドローンを動かすことができた初めてのケースだからだ。
誰もプロフェッサーXに手を出したくない。あの男は危険だ。プロフェッサーXはハルクを倒せるのか?理論的にはプロフェッサーXは集中して精神的なつながりを確立し、ハルクの精神を停止させたり、ブルース・バナーに戻すことができるかもしれない。しかしハルクのパワーは事実上無限で、激しい怒り、トラウマ、バナーの断片化した精神は時として精神的な制御に部分的な抵抗を示すことがある。
まあ、結論を言えば五分五分だ。これは簡単な答えが出ると思っていた。
動物のコミュニケーションについて、AIによる新しい洞察が得られた。アース・スピーシーズ・プロジェクトという非営利団体があり、AIを使って動物のコミュニケーションの暗号を解読しようとしている。これにより、動物が言語やおそらく言語ではないが、音声を通じてどのようにコミュニケーションを取っているのかを理解するのに役立つ。ああ、もしかしたら言語かもしれない。その境界線をどこに引くべきかわからないが、とても興味深い。
このプロジェクトはリード・ホフマンやローレン・ジョブズなどの大口の寄付者から支援を受けており、ナチュラルLMオーディオという新しいAIツールを立ち上げ、動物の音声を分析している。動物の音声を英語に翻訳すると人間的な解釈になるかもしれないが、彼らは人間ではない。2羽のカラスがお互いにチャープしているような場合、私たちには最初は理解できない彼らの世界のニュアンスがある。このモデルは、彼らが環境の中でお互いに対してどのような行動を取るのかを理解しようとしている。人工知能が取り組むプロジェクトとしてとても興味深いと思う。
イギリス政府が公式にAIを導入することになった。AIアシスタント・スイートを導入し、ハンフリーと名付けた。正直反対はしない。イギリスらしい名前だと思う。効率を高めるために部門間のデータ共有を改善することを期待している。全体として、有用である可能性は高くないと思うが、試してみる価値はあると思う。官僚制にAIを導入することには何か意味があるかもしれない。いずれにせよ、それは良い練習になると思う。
オシオ・デ・グレゴリオが「人間の認知のAIモデルが到来 - かつてないほど人間の心を理解する」という記事を書いた。とても興味深いモデルについて語っている。ケンタウロスと呼ばれ、GoogleのDeepMindを含むさまざまな学校や企業によって構築された。
人間の行動を、それが起こる前に予測することができる。これまで見たことのない行動や決定でさえ予測できる。脳活動パターンとも一致させることができ、タスク中の脳の部分がどのように活性化するかを予測するためにfMRIスキャンと文字通り一致させることができる。
トレーニングに使用されたデータセットはPsych 101と呼ばれ、160の心理学実験における1,000万の人間の選択が含まれている。おそらく最も興味深いのはその構造で、脳活動を明示的に学習していないにもかかわらず、その内部の仕組みが人間の脳活動と驚くほど一致している。人間のように行動し、その構造を見ると人間の脳のように見える。
これらの研究者たちは、心理学と人工知能を橋渡しする統一認知理論の構築に向けた大きな一歩だと主張している。オートエンコーダーのような以前見た説明可能性のためのツールを使ってこのモデルを知ることは、脳がどのように機能するかという人間の謎を解き明かし、おそらく脳がどのように機能するかを理解することにつながるだろう。
つまり、自分の頭の中にさえプライバシーはなくなり、あなたが行動を起こす前にその行動を知っているモデルが存在することになる。これは私たちの誰もが本当に深く想像したことのない、全く異なる世界だ。
しかしそれだけでは十分でないかのように、わずか21秒のfMRIデータを使って、5秒先までの脳活動パターンを予測できるトランスフォーマーが登場した。これは、Eleven Labsのような、あなたの声を数分聞かせるだけでその声を真似て話し続けることができるモデルのようなものだが、それが脳波の場合だ。
fMRIデータを使用して、約21秒の過去のデータだけに基づいて、最大5秒先までの将来の脳の状態を予測する。論文の目的は、患者のfMRIスキャン時間を短縮することだ。少しだけ脳をスキャンして残りのAIで推測し、後は推論することができる。子供向けのスキャンや、閉所恐怖症の人にとって素晴らしいことかもしれない。でも倫理的なジレンマも多く含んでいることは間違いない。
SoraやVideosやCingやVoを見ていて、3次元世界の映像をたくさん見て物理法則を理解するAIについて興味を持っていた。映像を撮影するとき、重力や原子、電磁気、その他の現実のものがあるからだ。実際に物理を学習しているのか、それとも物理の映像を学習しているのか。
この研究は非常に興味深い。生成的なビデオモデルは映像を見ることで物理的な原理を学習するのかと問う。これを調査するために、彼らは素晴らしいアイデアを持っていた。研究者たちは物理IQベンチマークと呼ばれるものを開発した。重力、流体力学、磁気などの概念の理解を評価するように設計されたデータセットで、すべて予測タスクを通じて行われる。
物理法則は本当には理解していないようだが、ただし注釈がつく。研究によると、現在のモデルは視覚的にリアルなビデオを生成できるが、現実世界の物理的な理解は弱いままだという。これらのモデルは、物体が別の物体の前にあるときや、水の入ったグラスを落としたときに、グラスが硬くて液体が濡れているということを知っているように見えるが、まだそれを本当には理解していない。
しかし、これはどのモデルもできないということではない。これらは仮想の目だけだということを覚えておいてほしい。映像の中に入って物を触れる仮想の手や、現実の物体を触る仮想の手があり、そしてこのような映像を見る目があって、モデルを組み合わせれば、物理的な原理を理解できる可能性は十分にある。いずれ解決できるだろうが、物理的な世界にいなくても物理的な世界を学べるのかが気になっていた。そして、ある程度はできないようだ。
LinkedInのイーサン・マロックが言う。世界銀行によるナイジェリアでのGPT-4をチューターとして使用する無作為化対照試験の新しい結果では、6週間の放課後教師主導型AIチュートリングによってテストスコアが3標準偏差上昇し、これは通常の学習で2年分の向上に相当し、他の教育介入の80%を上回る成果だった。
見てください、ムスタファ・スアンからの返信まである。「これこそ私がAIに情熱を持っている理由です」。まあ、マイクロソフトで年間100万ドル稼いでいることも関係あるかもしれないが、アクセスと機会を開くことが重要だ。多くの学生がこれまでコンピュータを使ったことがなかったことを考えると、さらに驚くべきことだ。私にとって最も意味のある点は、参加した学生が6週間の介入で扱った範囲をはるかに超えたトピックを含む学年末試験でも好成績を収めたことだ。
大規模言語モデルに頼ることで私たちが「バカになっている」という考えとは対照的に、教育目的で使用する場合、大規模言語モデルは素晴らしいツールだ。
アントン、どうした?YouTubeでこの人の動画を見るべきだよ。「腸内細菌叢と人間の知性との直接的な関連」という動画を投稿した。人間の知性に影響を与える経路としては普通考えないが、考えを改めている。
私たちの胃の中の腸内細菌は、ただ食べ物の消化を助けているだけではない。彼らは私たちの腸の中で非常に長い間生活してきたため、本質的に共生関係を持っている。科学者たちは今、彼らの活動が私たちの考え方、感じ方、行動にどのように影響を与えているのかについて、ますます多くのことを学んでいる。
研究によると、睡眠や空腹感から脳機能まで、腸内細菌の健康が実際にすべてに影響を与えていることが示されている。これは、赤ちゃんがいつ食べ、排泄し、睡眠をとるかを予測する特定の分子の証拠があり、それが感じ方や考え方、行動の生涯にわたるパターンを確立するという仕組みだ。育児や子育てについて誰も話さないことだ。健康な腸内細菌に焦点を当てる人がいるのか?もしかしたら私たちはそうすべきかもしれない。
さらに注目すべきは、これらの腸内細菌の違いが自閉症や不安と関連していることだ。実験では、不安を引き起こす微生物がマウスに社会的恐怖を伝達できることも示されている。ジョナサン・ハイトの「不安な世代:子供時代の大きな再配線がメンタルヘルスの流行を引き起こしている」という本を読んだが、その世代が多くの消毒剤や人工的な食品、奇妙な化学物質が存在する時代に育ち、腸内細菌や食事に繊維や健康的な自然食品が十分含まれていなかったことが、歴史上最も不安な世代を生み出した原因の一つかもしれないと考え直したくなった。
この動画を見るまで全く知らなかったもう一つのことは、腸内細菌が人間の脳を大きくする助けとなった可能性があることだ。そうだ、ある種の微生物とその副産物が、脂肪を蓄積するのではなく、脳のエネルギーを優先することが分かってきた。
アレン博士は、ChatGPTのような大規模言語モデルの広範な使用が、メール、トリビア、研究、生活管理に使用されることで、すでに私たちの認知能力を低下させる可能性のある特定の精神的ショートカットを助長しているように見えると書いている。私たちは以前にも人間の知性に大きな打撃を受けている。これを読むのは非常に悲しい。
環境中の鉛のせいで平均的な人が2.6 IQポイントを失ったことを知っているか?私たちは文字通り社会を愚鈍にしている。鉛を取り除いてくれて嬉しいが、そんなことが実際に起こったなんて信じられない。世界中で愚鈍になった人々の数を掛け合わせると、8億2,400万ポイントだ。何という...GDP換算で世界にどれだけの損失があったのか。鉛会社はその過ちのために世界に数兆ドルの借りがある。
60年代と70年代の特定の出生コホートが特に大きな影響を受け、一部の個人は7.4 IQポイントを失い、知的障害の範囲にシフトするほどだった。
これは「社会におけるAIツール:認知的オフロードと批判的思考の未来への影響」という論文で、特に若者に焦点を当てている。彼らはすでにこの種のテクノロジーを特に多用しており、AIにあまり依存しない高齢者と比べて深い思考への関与が低下しているようだ。
結論として、AIは非常に便利だが、過度の依存は私たちの精神的な鋭さを犠牲にする可能性がある。前回の動画で言ったように、私も例外ではない。10年前と同じような認知的な負荷に耐えられなくなっているような気がする。ちょっと不安になってきた。
ソーシャルメディアとそれを動かすアルゴリズムについて話そう。TwitterやFacebook、TikTok、言論の自由、インターネット上の公共広場のような自由な場所について、なぜコンテンツの調整方法についてばかり話し、アルゴリズムの仕組みについては話さないのか?
なぜ企業がアルゴリズムを決めることが許されるのか?望む方向に傾けたり、教育に焦点を当てたりできるアルゴリズムを私たちが選べるとしたら。それが機能するかどうかはわからないが、Blue Skyには何か違うものがあることを知っておくことが重要だと思う。異なるプロトコル、異なる配管を持ち、少し異なる存在だ。
残念ながら、Blue Skyの実際の体験は私が期待したほどではなかった。まだ堅牢なエコシステムには感じられない。でも、分散型暗号通貨のようなものだと思う。時には、現在の姿よりも、世界にどのような影響を与えることができるかを知っているからこそ、応援したくなるものがある。
Blue Skyはオープンプロトコル上に構築されており、ATプロトコルと呼ばれている。これにより、誰でも独自のバージョンのソーシャルメディアプラットフォームを作成・カスタマイズできる。非営利のガバナンス、冗長なサーバー、コミュニティ主導のエコシステムを持つ、ウィキペディアのようなソーシャルメディアバージョンだと思う。うまくいくことを願っている。
自分の注意力を実際にコントロールできることを想像してみて。期待に応えられないかもしれないが、常に注意を盗もうとする企業の利権がないとしたら、どれほどクールだろうか。
GPT-5の噂について、アルベルト・ロメロが記事にまとめている。噂によると、OpenAIにはすでにGPT-5があるが、一般の人々はアクセスできないという。これはありそうだし、非常に現実的だ。なぜ一般公開しないのか?内部にとどめておく方が価値があるからだ。
OpenAIがそれを隠しているとしたら、蒸留というプロセスを通じて、より小さな安価なモデルを超強化するために使用できる。たとえO3が大きく見えても、GPT-5よりもはるかに小さいかもしれない。特にO3 miniは、非常に優れたパフォーマンスを発揮しながら、実行コストを抑えることができる。
内部的な質問に答えたり、独自のシステムをコーディングしたり、アプリを改善したりする場合、GPT-5に問い合わせて、GPT-3モデル用のすべてのトレーニングデータをエクスポートしているのかもしれない。明らかに推測だが、財務的な観点からすると、GPT-5は実行コストが非常に高く、本当に重要なことにしか使用できないのかもしれない。
競合他社が持っていなければ、彼らほど速くコーディングできないし、深く考えることもできない。OpenAIが科学研究を発表し始め、長寿研究に参入しているのを見た。GPT-5モデルからそのような情報を得ているのかもしれない。OpenAIが長期的な支配を優先しているとは思わないか?彼らの最高のテクノロジーを製品ではなく秘密兵器にしているとしたら?
2回目のチャンスだ。最初の機会を逃した場合は、私のPatreon、Dillan Curiousに参加できる。YouTubeを使用している場合は、この動画の下にある参加ボタンを押すこともできる。基本的に同じような会員制モデルで、チャンネルに大きな助けとなる。
最後に共有したいコンセプトは、もう少し抽象的で、もう少し空想的なものだ。マット・フジモトによる「現実を経験する方法の統一:日本哲学の新しい進化としての天守」だ。名前の発音は難しいが、哲学は素晴らしい。
実は、その単語は人名で、天守は日本の哲学者だ。彼は私たちが世界を経験する通常の方法を逆転させた。
基本的に、平均的な人は何かを想像するよりも体験する方を好むだろう。美しい夕日を実際に見て、空気を感じ、感覚を得る方が、友人からその話を聞くよりも良いと思うだろう。しかし天守は、感覚的なものであれ、想像的なものであれ、精神的なものであれ、すべての形態の経験は平等であり、同様に有効だと主張している。
そして彼は、豊かに相互接続された経験を融合させる現れという概念を導入する。何かを実際に経験し、それを心の中で追体験するとき、それは起こっていない。再び感じているわけではなく、ある意味で現れなのだ。通常の使い方ではないが、彼の用語では、それはすべてが混ざり合って知覚となる。
例えば、川を見ること、それを思い出すこと、想像することはすべて現れであり、順位付けするのではなく統一されるべきだと彼は言う。これにより、日常的な経験に基づき、現代の言語的・分析的な視点を取り入れながら、日本哲学を新しい方向に押し進めている。
おそらく、少なくとも私のような西洋人の考え方に挑戦している。私たちの文化には心身二元論があり、そのような順位付けを自然にしてしまう。しかし、もしそれが階層ではなくウェブだとしたら?写真をスクロールしたり、何かについて読んだり、想像したりすることが、実際にそこにいることと同等だとしたら?それはレディ・プレイヤー・ワンの世界だ。
そして人工知能システムの中にある画像を生成したり考えたりすることが、私たちと同じように生きているとしたら?そのような問いに正解はないが、コメント欄で皆さんの考えを聞かせてください。次の動画でまたお会いしましょう。ご視聴ありがとうございました。

いいなと思ったら応援しよう!