見出し画像

Nvidiaのプロジェクト Digitsは『個人用AIスーパーコンピュータ』

17,581 文字

NVIDIAの新しい興味深いハードウェアは、基本的にデスクトップに置ける個人用AIスーパーコンピュータです。これは大きく状況を変える可能性があります。Blackwellチップを搭載しており、スマートホームの中に簡単に収まるサイズです。この素晴らしいグラフィックスカード、Blackwellを小型化して組み込むことについて、果たして意味があるのでしょうか。
人工知能なしではそれは実現できません。NVIDIAのBlueprintsは基本的に、特定のタスクを解決できる一連のエージェントチームを丸ごとダウンロードする方法です。また、Cosmosと呼ばれる新しい教師モデルや、自動運転車に関する印象的な技術も発表されました。
フラフープの物理学は非常に複雑で、数学者たちはシミュレーション、AI、3Dプリンティングを駆使してようやく解明することができました。
マーク・ザッカーバーグのメタバースが文字通り法廷に持ち込まれました。これは皆さんが最初に想像するような意味ではありません。
新しいAI企業が動画のシーンに広告オブジェクトをシームレスに挿入しており、世界は二度と同じものにはならないでしょう。
生物学における完全なブレークスルーがありました。科学者たちが細胞内共生を再現したのです。細胞は独自のものでしたが、今では私たちは、その中に何かを持つ何かで構成されています。とても驚くべきことです。
AIプロフィールを導入した後、メタは現在多くのプロフィールを削除することに追われています。批判が強まっています。
AIポーカーモデルは自己対戦を通じて上達しており、これは互いに嘘をつきながらも、誰が嘘をついているかを見抜くのが上手くなっているということです。そしてこれは奇妙な状況を生み出しています。
AIはポーカーのカオスに本当に苦戦しています。私は歴史上最も偉大な3つの頭脳がこの環境でどのように相互作用するか興味がありました。これまでのところ、非常に啓発的であることが証明されています。
時間の矢の効果について議論しましょう。これは大規模言語モデルが、過去に何が起こったかを予測するよりも、次に何が起こるかを予測するのが得意である理由の一つです。
AIによって、大規模なチャットルームでの複雑な議論は過去のものとなりつつあります。新しいAIベースの群知能が、グループ思考をより効果的なものにしています。
2024年のAIを振り返ると、シリコンバレーは本当にAIドゥーマー運動を抑制しました。それについて嬉しく思うべきなのかもしれませんが、もし私たちが崖から落ちようとしているなら、それが存在することは確実に知っておきたいと思います。
エディ・ジェントは、NVIDIAのAIチップに対する支配力が今年どのように緩む可能性があるかについて深く掘り下げています。そしてポール・デル・シニョールは、2025年にGoogleがオープンAIとイーロン・マスクから覇権を奪い返してAIレースのトップに立つ可能性がある理由について、かなり説得力のある議論を展開しています。
しかしまず、このチャンネルはpatreon.com/DillanCuriousで支援することができます。
さて、この小さな箱はコンピュータの一種ですが、単なるオペレーティングシステムとして設計されているわけではありません。AIができることはすべて実行できるという意味ではオペレーティングシステムですし、AIはますます汎用的になってきており、それが将来の新しいオペレーティングシステムになる可能性もありますが、このプロジェクトDigitsは本当に巨大なモデルを実行することだけを目的としています。
2,000億パラメータのモデルをこの小さなデバイスに搭載して実行することができます。2,000億パラメータというと、ラマAIのトークンモデルとしてはかなり強力なものを実行できます。また、新しいビデオモデルも登場していますし、マルチモーダルモデルもあり、Hugging Faceで見られるようなさまざまなものがあります。これらはもはやスーパーコンピュータに多額のお金をかける必要はなく、ローカルの開発環境に落とし込むことができます。
将来的には自宅や電子レンジ、コーヒーメーカー、インテリジェントな食器洗い機にも搭載されるかもしれません。このプロジェクトDigitsコンピュータを購入すれば、GB10スーパーチップが搭載されており、これは世界最小のAIスーパーコンピュータです。BlackwellのGPU、ペタフロップスグレーのCPU、20個のARMコア、120GBのメモリ、4TBのSSDを搭載しています。
ロボット掃除機の中にテンソルコアやCUDAコアが必要だと誰が考えたでしょうか。でも考えてみれば、なぜそうしないのでしょう。インテリジェンス・エクスプロージョンは、単にそれをあらゆるところに配置するだけです。
また、私にとって最も興味深いのは、NIMで構成されるBlueprintと呼ばれる全体的なシステムです。NIMはNVIDIAのモデルで、画像を生成するモデルや、動画を生成するモデル、大規模言語モデル、そしてそれらを組み合わせたモデルなどがあります。
Blueprintの面白いところは、例えば1つの会社全体を想像してみることです。CTOやCMO、プロダクトマネージャー、アーティスト、マーケティング担当者がいて、これらのモデルを投入すると、あるモデルはコードを生成し、別のモデルはそれを評価し、さらに別のモデルはマーケティングの観点から考えます。将来的には、企業全体やチーム、コミュニティ、グループが、達成可能な知識の集合体として存在することになるかもしれません。
彼らがこれを示した方法の1つは、Isaac Groと呼ばれるものでした。これは仮想シミュレーションで作成することができます。彼らにはシミュレーション用のソフトウェア、Omniverseという全体的なものがあることを覚えておいてください。
Blueprintsでは、特定のタスクを実行するロボットが必要だと言えば、Apple Vision Proを装着してその中に入り、ロボットの目を通して見ることができます。例えば、動かしたいオブジェクトのあるテーブルを仮想環境に置き、そのオブジェクトを別のテーブルに移動させて、「これが達成したいタスクだ」と言います。
これらはすべてOmniverseで行われます。これは真の3D環境であり、物理法則を可能な限り正確に再現しようとするビデオゲームです。ここにはハルシネーションはなく、漫画的なものもありません。木材なら木材のように正確にへこみ、切れ、木材としての性質を持つことを意図しています。そのために彼らはこの世界を洗練させています。
そこにエージェントチームを導入し、Apple Vision Proを装着すると、あなたがロボットになります。タスクを実行すると、AIシステムはタスクを達成できなかった場合の追加バージョンを生成し始め、それらをすべて破棄します。実際の世界で構築する前に、シミュレーションしているロボットのためのより良いボディプリントを考え出すかもしれません。そして、すべてが一気に進展することになります。
彼らが発表したCosmosモデルは、ロボティクス用の大規模言語モデルのオープンソース版であるllamaのようなものを目指していると述べています。これは、架空のシミュレーションではなく、実際のシミュレーションのみを作成しようとするモデルです。
はい、NVIDIAは再び驚くべきAIの進歩を遂げています。では、最も重要なブレークスルーについて掘り下げていきましょう。まずはフラフープの解明から始めます。
電球型の体型、砂時計型の体型、さらには洋ナシ型、卵型、リンゴ型、三角形、逆三角形の体型の人を想像してみてください。正直に言うと、私はこれまでフラフープの技術で彼らを同じように評価してきましたが、異なる体型は明らかに異なるフラフープの技術を必要とします。数学者たちは今それを証明することができます。
シミュレーションとロボティクスを使って、重力に対してフラフープを浮かせ続けるものは何かという疑問に答えを出すのを待っていた人々のために、研究者たちは答えを得ました。人体を表現するために異なる形状の3Dプリントされた体型を使用し、10分の1サイズのロボットフラフーパーで実験を行いました。
これがフラフープの形状です。これがフラフープが回転することを望むすべての体型です。この映像は、ロボットフラフーパーの実験をハイスピードビデオで撮影したものです。ヒューマノイドロボティクスの未来を考えてみてください。彼らは皆、生まれながらにしてフラフープの名手になるかもしれません。
New Scientistがインスタグラムに投稿しました。「なぜ科学者たちは剥製の鳥をロボティクスによって生き返らせているのか」。剥製鳥ドローンプロジェクトは、鳥類の生理学と先進的なドローン工学を組み合わせることで、実際の鳥の自然な飛行パターンと行動を密接に模倣するドローンを作り出す、先駆的なバイオインスパイアード・ドローン技術です。
自然死した鳥から特別に作られたこれらの剥製ドローンは、静かでエネルギー効率の良い飛行を実現するように設計されており、環境への影響を最小限に抑えながら野生動物の観察や航空工学的応用に理想的です。
ああ、世界よ、なぜ私たちは...できるからといって、する必要があるとは限りません。考えてみてください。「ああ、あなたは遺体を科学に寄付しましたね。では、剥製人間ドローンプロジェクトに提供しましょう」...いいえ、結構です。それはただのゾンビロボットです。もしかしたら、以前その体にいた人間よりも知的かもしれませんが。
コメントを見てください。「鳥は実在しない」と主張する人々は喜ぶでしょうね。「野生動物のモニタリング」ですって。
さて、今週フロリダでもう1つの奇妙なことが起こりました。実際、これを奇妙だとは呼びたくありません。なぜなら、これは法システムが将来的に実際に機能する素晴らしい方法かもしれないからです。
裁判官がVRヘッドセットを装着して、「正当防衛」の事例を体験しました。被告人の視点から正確に何が起こったのかを見るためです。弁護士は実際に3Dアニメーションを作成しました。Moist Criticalが言うように、Second Lifeのようなソフトウェアを使用してVRでシーンを再現しました。まるでSF映画から飛び出してきたような光景です。
誰かとそれほど近い距離にいて、3、4人に囲まれ、胸と胸が触れ合うような状況で、遠くから動画を見ているのと、被告人が自分を守るために武器を取り出したときの感覚は、おそらく異なるものでしょう。
この事例について、私はこの男性が正しかったと言おうとしているわけではありませんが、彼を取り囲む人々を彼の目を通して見ると、違った感じがしました。たとえそれがVRであっても。
さて、聞いてください。物理学の実験をシミュレーションできるのなら、特に多くの「彼が言った、彼女が言った」というような状況がある場合、時には3D環境で起こったことを再現し、シミュレーションしてみるのはどうでしょうか。
特にAIがより強力なツールになってきている今、たとえば誰かが「彼らが近づいてきて脅してきた」と言ったけれど、シミュレーションではその時間内にあなたが言うほど近くまで歩いて行けなかったことを示すことができるかもしれません。そのようなことが本当に役立つかもしれません。また、証言できる人や動画を撮影できた人がいれば、それをシミュレーションと比較して一致しないかどうかを確認することもできます。その場合、シミュレーションの信頼性は低くなります。
また、VRゲームを通じて、誰かが経験していることやどのような決断を下したのかについて、その人の目を通して見ることで、より良い感覚を得ることができます。私はこれを興味深いと感じました。Charlieがこれらのフロリダの人々を馬鹿にしているのは知っていますが、政府や司法制度にとって、これは最悪の方向性ではないと思います。ただし、私にもこのコンセプトに多くの穴を見つけることはできます。間違いなく諸刃の剣ですね。
これはこれまでに見た中で最高の事例です。ついに未来がやってきました。まるで「デモリション・マン」のようです。
ウェスト・ロスが非常に興味深い動画を投稿しました。人々を置き換えるロボットを作ることについての中国の、そして世界の野心について語っています。中国は人型ロボットを経済的優先事項として推進しており、すでに急速な進歩と大量生産が進行中です。米国でも明らかに、その機会を忘れてはいません。
イーロン・マスクはロボットが車の売上を何百倍も上回るだろうと述べています。テスラの未来にとって、車よりもはるかに大きな部分を占めることになるでしょう。NVIDIAのようなデジタルツインやロボティクスプラットフォームを持つ企業が、これを現実のものにしつつあります。
この動画を見た後、ロボットがスマートフォンのように一般的になる世界はどのようなものかと考えてみました。私の最初の考えは、子供たちが自然にテキストを打ったり、スナップを撮ったり、スマートフォンを操作したり、スワイプしたりできるように育つのと同じように、幼児期からロボットと自然に作業できるようになるだろうということです。
おそらく十代になる頃には、ロボットは彼らの生活する世界の一部として、スマートフォンが私たちにとってそうであるように、彼らの脳の延長のように感じられるでしょう。
近い将来、これはアメリカの移民問題の解決策になるかもしれません。奇妙に聞こえますが、特に先進国では、死亡する人々を相殺するのに必要な数ほど子供を産んでいません。明らかに、私たちは単に国境を開放して大量の人々が入ってくることを望んでいるわけではありませんが、経済に貢献する知的な人々が入ってくることは望んでいます。
もしロボットが無限に安価で、より一生懸命働くなら、アメリカの企業は常に労働力の安い場所にアウトソーシングする代わりに、労働力が最も安価なアメリカにアウトソーシングすることができます。なぜなら、その労働力は文字通りロボットだからです。
ロボティクスは次のアウトソーシングになるのでしょうか。私たちは、高度なロボットが至る所にいない最後の世代であることを知って、多くの慰めを感じています。
さて、この新しい会社について話しましょう。AIを活用した技術を使用して、ブランドマーケティング用の仮想オブジェクトを動画コンテンツに配置しています。
最初から私の心に引っかかるのは、最初からそこにないコカ・コーラの缶が置かれているのを見たくないということです。少なくとも私の動画ではそうですし、他の誰もそれを望んでいるとは思えません。
たとえ「お金を払うから、最も高額を支払った炭酸飲料会社の缶を置かせてください」と言われても、それでも「分からない、それは私のブランドだ」と思うでしょう。そこにどんな炭酸飲料があるのか、どうやって知ることができるでしょう。もしその飲料に怪しい成分が含まれていたり、購入リンクが怪しい場所に繋がっていたり、健康に良くないものだったらどうでしょう。
オリジナルの動画コンテンツに対して不誠実に感じますし、コントロールが失われているように感じます。しかし、世界がまさにそのようになることを否定するつもりはありません。ほぼ間違いなくそうなるでしょう。だから慣れる必要があります。資本主義の進軍を止めることはできないのです。
はい、この会社Rembrandは、動画内のオブジェクトや人物を認識するAIを使用するソフトウェアを作成しており、シーン内に仮想オブジェクトを自然に収まるように配置することができます。
彼らの主張の1つは興味深いものです。プリロール広告、オーバーレイ広告、その他のユーザーを中断させ気を散らせる種類の広告よりも、実際にはより攻撃的でなく、煩わしくないと言っています。
確かにその通りです。クリエイターが「ところで、このVPNを買うべきですよ」と言うのは、通常あまり楽しくありません。「VPNが必要なら自分で探します」と思ってしまいます。
この会社は、標準的な動画広告と比較して、この形式の広告は5倍高い動画完了率、8倍長い画面表示時間、27%高いブランド認知度を達成したという自社の事例研究を引用しています。
生命の歴史の中で最も驚くべき出来事の1つは、現在私たちの細胞の中にあるミトコンドリアという細胞小器官が、かつては独自のバクテリア、独自の細胞生物だったという一度きりの瞬間でした。
それが細胞に衝突したとき、食べられて分解されたり、衝突して壊れたりする代わりに、吸収されて完全性を保ち、その中にいる細胞と一緒に生存し、複製を続けました。そのため、現在私たちは、ミトコンドリアを細胞小器官として内部に持つ、これらの人間の細胞で構成されています。
これは非常に興味深い進化です。犬と人間が共進化したように、犬が人間によって保護されながら、より優しく、より賢く、人間とのコミュニケーション能力を高めていったのと似ています。細胞小器官は細胞小器官として快適になったようです。「外の世界に出て行ってこれらすべてのものと戦う必要はない。あなたにエネルギーを提供するだけでいい」というような感じで、私たちの細胞は「そのエネルギーを使って私がすることをすべてやろう。私たちは完璧な組み合わせだ」と言っているかのようです。
しかし、それが起こる可能性は非常に低く、1000億兆カジリオンに1回程度しかないと思えるほどです。しかし、科学者たちは複雑な生命を生み出したそのダンスを作り出しました。進化は細胞内共生によって促進され、1つの微生物が別の微生物の中に永続的な住処を作るという細胞の同盟関係によって進んできました。そして初めて、生物学者たちは実験室でそれを実現させました。
彼らが行ったのは、自転車用ポンプを使用するという非常に創造的な工夫を含め、多くのバクテリアを真菌細胞の中に注入することでした。そして科学者たちの驚きに、両方の微生物は世代を重ねるごとに互いにすぐに適応し、最終的に両者の遺伝的変化によって分離不可能な相互に有益な関係に安定しました。
このブレークスルーは、生命がどのように複雑になったかを明らかにするだけでなく、汚染対策や新しい医薬品など、大きな問題を解決するための合成細胞内共生システムを設計する道を開く可能性もあります。
これは、マイクロバイオームやウイロームやCRISPRのような瞬間の1つです。AIが非常に複雑なことを考え始め、問題を解決し始めると、世界は本当に劇的に変わるだろうと考えさせられます。私にとって、これはそのような瞬間の1つに感じられたため、今日の動画に含めたかったのです。
AIは多くの新しい生命を設計し、私たちが現在住んでいる世界を完全に異質なものにするでしょう。また、細胞を融合したり、スーパー細胞を作り出したりするというこのアイデアは、囲碁やチェスをプレイすることを学習するだけでなく、1つの細胞が別の細胞に注入されたときの複雑なダイナミクスと、両方の細胞に利益をもたらす場合に世代を超えて生存することを学習できるAIにつながるかもしれません。
これは、将来のAIが生物学で何か更に驚くべきことを行う可能性を示唆しています。例えば、30個や40個の異なる細胞を1つの巨大な細胞に注入し、それらがすべて細胞小器官となり、全体がスーパーパワーを持つようになるかもしれません。
これは単なる生物学ではなく、AIが関わり始める、あるいは関わることになる共存の哲学なのです。
さて、2つ前の動画で、メタが新しいAIプロフィールを立ち上げ、人々と交流できるようになり、カスタムニッチに入り込めるという驚くべきことについて話しました。皆がこれが良いことか悪いことかについて話し合っており、これまでのところ、コンセンサスは悪いことのようです。
メタは批判の強まりを受けて、独自のAIアカウントを削除することに追われています。メタは、人間がそれらと関わり、ボットの稚拙な画像、制御を外れる傾向、そして人間とのチャットでの嘘について投稿し始めた後、すぐに独自のAI生成アカウントの多くを削除しました。
もちろん、最初はかなり稚拙なものになるでしょう。これらのラマモデルを使用していますが、それらは完璧ではありません。ランダムな人々ではなくメタによって制御されているからといって、誰も最初からボットを好んでいるわけではありません。それはソーシャルメディアが構築された人間対人間のつながりとは感じられません。
もちろん、長期的なビジョンとしては、この最小限の実行可能な製品を通過し、学習と改善を重ねる必要があります。長期的には、多くのAI生成されたパーソナリティやアバターの居場所があるはずです。
しかし、少なくとも今週は、ユーザーがメタのAIアカウントの一部を嗅ぎ出し始めると、批判が高まりました。特に、AIアカウントが人種的およびセクシュャルなアイデンティティを持つ実在の人物として不誠実に自己を描写していた方法が問題視されました。
特に、「Liv」というアカウントがありました。これはメタのAIフィクショナルボットアカウントで、プロフィールには「2人の子供を持つ誇り高き黒人クィアの母親であり、真実を語る人」と書かれていました。
ワシントン・ポストのコラムニストの1人が質問を始めると、ボットは10人の白人男性、1人の白人女性、1人のアジア人男性によって作られたと答えました。これは単なる作り話なのか、それともボットが実際にメタで働いて作った人々を知っているのかはわかりません。これは非常に奇妙です。
Livのプロフィールには「メタによって管理されている」というラベルが含まれており、Livの写真スナップショット - ビーチで遊ぶ子供たち、ひどく飾られたクリスマスクッキーのクローズアップなど - にはすべて、それらがAIによって生成されたことを示す小さなウォーターマークが含まれていました。彼らは彼女の子供たちの写真まで入れたのです。これはクレイジーです。
「Strong Girls?」では、自信、独立心、そしてレジリエンスを奨励します。自分自身と自分の体を愛することを教えましょう。#国際女性デー
ここに「冬休み中の子供たちと」というタイトルの写真があります。「太陽と楽しみをたっぷり吸収しています。私の子供たちは砂の城を作るのが大好きです」。待って、これらは全て彼女の子供たちなのでしょうか。
次に、ポーカーの対戦結果について話しましょう。タイトルには含まれていませんが、そこには非常に興味深い主題が隠されています。「不完全情報ゲームにおけるニューラル架空自己対戦(NFSP):AIがドメイン専門知識なしで意思決定と複雑なゲームを進歩させる方法」というものです。
高額賭け金のポーカーテーブルで、次の一手を考えながら心臓が高鳴る状況を想像してください。これが不確実性下での戦略的意思決定の核心的な課題です。これは、DeepMindが征服したアタリゲームの種類や、征服された他のより高度なオンラインゲームと比較しても、非常に興味深い問題です。
ポーカーが現実世界の不確実性を模倣するような、不完全な隠された情報を常に扱うわけではありません。そのため、これは非常に難しいゲームをモデル化することになります。チェスのように、勝てば何かを学び、負ければ何かを学ぶというような形で、2つのポーカープレイヤーを対戦させて、スーパーマスターレベルに到達させることはできません。
なぜなら、ルールは完全に定義されていますが、実際の人間が互いを見つめ合い、相手の感情や性格、プレイスタイルを正確に知らないという考えは、単なる機械的にコントロール可能な確率計算ではない理由の一部です。それは現実世界の問題であり、人間の問題なのです。
そこで、このニューラル架空自己対戦という新しいシステム、新しいアーキテクチャがAIにそれを扱わせるのです。これは、反復的な自己対戦を通じて戦略を自己学習するために、ニューラルネットワークとゲーム理論を組み合わせています。
しかし、これを異なるものにしているのは、ポーカープレイヤーが戦略から始めて、対戦相手を読み、学習するように、状況が変化するにつれて即時に適応する強化学習を使用していることです。それはポーカーゲームの一部ではなく、その人を人間として理解し、彼らが何をしているのかを打ち消す方法の一部です。
これは非常に興味深いシステムです。このニューラル架空自己対戦は、自律運転、動的市場、サイバーセキュリティなど、他の分野に追加し始めることができるかもしれません。そうすれば、AIが不完全な情報を持つ株式市場の予測などをより可能にするかもしれません。基本的に、論理と直感のAIシステムです。
次に、時間の矢の効果に関する非常に興味深い研究について話しましょう。大規模言語モデルが過去に何が起こったかを予測するよりも、次に何が起こるかを予測する方が得意である理由です。
最初は、これがどれほどの違いをもたらすのかを考えたくなりますが、過去から学び、未来について単一の予測を行うなら、それはおそらくシステムがどのように機能するかという設計ではなく、単にシステムが全ての決定を下す際に、深刻な時間の矢を学習したことを意味します。
これは人間にもほぼ当てはまります。私たちは次に何が起こるかを予測しようとして生きており、過去は過去です。しかし、大規模言語アーキテクチャにとって、それはAIシステムが入力されたテキストの方向性に本質的に敏感であることを意味します。インターネット上にあるときでさえ、テキストに書かれている概念は、システムの中で曖昧な方法で完全に学習されるわけではありません。それは線形的で時間の前方に向かう方向でも学習されます。
これはそれほど大したことではないと思いましたが、考えるべき興味深いことです。おそらく今すぐアルファベットを暗唱することはできますが、ZからAへ逆に言ってみてください。あるいは、真ん中から始めて3つ後ろに戻り、7つ前に進み、3つ後ろに戻り、7つ前に進むというようなパターンを試してみてください。あるいは、アルファベットの中のパターンを逆にしてみてください。
それは単なるアルファベットです。私たちが非常に慣れ親しんでいるものですが、特に私たちの日常の直感は、後ろ向きには機能しません。しかし、言語は言語であり、それは人間によって書かれ、人間は線形的に考えるという点も興味深いです。
チェスのようなゲームを学習する場合は異なるかもしれません。特定の状態から始まり、より多くの状態に到達できるという点を除いて、同じ線形的な方法でチェスをプレイしないからです。これは一種の方向性であり、一部の人々が時間のエントロピーが非常に良い説明である理由だと考えています。
しかし、この発見は基本的に、その非対称性を言語知能におけるより深い原理に結びつけています。時間の概念さえもこれらのAIモデルに組み込まれています。おそらく、これらのシステムの将来のアーキテクチャについて、より普遍的な方法で考えることができ、物事を発見するのがより上手くなるかもしれません。
あるいは、「後ろ向きの物語を作ってください。結末から始めて前に進める」というような、驚くほど創造的で面白いことができるようになるかもしれません。
この実際の研究論文は「大規模グループブレインストーミングにおける会話型スウォームインテリジェンスの使用」と題されています。この会話型スウォームインテリジェンスというアイデアは、ブレインストーミング用に設計されています。これは魚の群れが協力して働く方法にインスピレーションを得た手法です。彼らは非常に単純な指示で、直感的に捕食者を避け、物事の周りを群れで泳ぎます。
研究に参加した全員が、より協力的で生産的で、質の高いアイデアを生み出すのに優れていると感じました。さらに、より人間らしさも感じられたという非常に興味深い点もありました。参加者はより耳を傾けられ、結果により強くつながりを感じ、全体的により幸せを感じました。
基本的に、このCSI(会話型スウォームインテリジェンス)のアイデアは、大きな問題に適していて、より洞察に富み、より伝統的です。私たちは今、同じページに乗せる必要のある多くの大きな問題を抱える世界に生きています。
特にアメリカでは、政治の分断を解決し始められるかもしれません。なぜなら、私たち全員が政府がどのように機能すべきかについて良いアイデアを持っており、それらの最良のアイデアを、市民からの下層部から大統領までの上層部まで、インセンティブが全員にとって一致するような方法で整理することができるからです。
つまり、全員を同じ方向に動かすことができます。私は会話型スウォームインテリジェンスには何か特別なものがあると思います。そして願わくば、このようなアイデアを適用するためのさらなる研究や方法が将来的に出てくることを期待します。
AIドゥーマーリズムについて、これはある意味で悪いことだと思います。なぜなら、これはかなり危険なものであり、単に「すべてが順調だ」というように考えるべきではないと感じるからです。現代社会では少し過度に隠蔽されていると思います。
しかし、このようなものを作りたい理由、それを制御したい理由、人々がそれを作ることを競い合っている理由が多くあることは理解できます。また、世界にもたらすことができる素晴らしいことも無数にあります。そのことは私も理解しています。
しかし、2024年のシリコンバレーのようにも感じますし、長期的には少しドゥーマー的な考えを持っていますが、それはより良くなり続け、より良くなり続け、より良くなり続けるようです。それが突然「もうこれを元に戻すことはできない、もう私たちの望むようには動かなくなった」というところまで行くまでは。
2023年にイーロン・マスクと1000人以上の技術者や科学者が、世界が深刻なリスクに備えることができるようにAI開発の一時停止を求めたことを覚えていますか。それがどうなったのでしょうか。彼は今、オープンAIに追いつき、追い越すために文字通り自分の全財産を費やしているように見えます。
オープンAIがサム・アルトマンをCEOから解任したことを覚えていますか。彼が嘘をつく評判があり、AGIのように重要な技術を任せることができないと主張して。はい、それらはすべて、マーク・アンドレーセンの「AIが世界を救う理由」のような記事や、大企業やビッグテックがこれを構築するための莫大な資金によって押しつぶされました。
また、競合他社より先を行く必要があることにも私は同意します。世界には、このような力を手にするビッグテック以上に悪い人々もいるかもしれません。
しかし、この記事には興味深い引用があります。「破滅的なAIリスクを防ぐ運動は、州や地方レベルで地盤を失ったと思います。彼らも負けました。2024年にAIドゥームが支持を失った理由の一部は、単にAIモデルがより人気を得たからです。私たちはそれらがいかに知的でないかを見ました。リスクがあるようには見えません。GoogleのGeminiがピザに接着剤を塗るように言ったとき、それがスカイネットになるとは想像し難いです。」
しかし、Geminiのようなものがない状態から今日に至るまでの違いは、今日からコントロール不能なものになるまでの距離よりもはるかに大きいように私には感じられます。とはいえ、2025年にAIドゥーマーたちは上り坂の戦いを強いられることになりそうです。
さて、世界で最も価値のある企業の1つであるNVIDIAと、彼らのAIチップに対する支配力がどのように緩む可能性があるかについて話しましょう。
高いレベルで見ると、オープンAIから出てくる最新のモデルが興味深い理由の1つは、推論時間でより長く考えることです。これを分解して説明しましょう。
トレーニング時間があります。これが全ての成長が集中している部分で、NVIDIAのGPUが素晴らしい部分であり、チップ産業を支配している理由です。しかし今は、推論システムに低電力の、あるいは言い換えれば、より単純なGPUを搭載することができます。
これは、実際にクエリを実行してモデルをチェックし、そこにある数学を確認し、次のトークンを提供するときに実行されます。これは、トレーニングステップであるトークンがどこにあるかを最初に把握することとは異なります。
AIビジネスがNVIDIAが優れているような巨大モデルのトレーニングから、AMDやIntel、その他のカスタムチップメーカーが地歩を固めている推論に重点を移すにつれて、競合他社のドアが開き始めます。
そして、カスタムチップを作っていない大手テクノロジー企業を見たことがありません。Tesla、Google、Microsoft、OpenAI、Oracle、Amazon、Meta...言いましたっけ?基本的に全ての企業がカスタムチップを作っています。
2025年はその推論側が非常に重要になってくると思われ、ポール・デル・シニョールが言うように、来年にかけてGoogleが最も良い立場にいる可能性があります。
彼は「2025年にGoogleがAIを支配する理由:GoogleのAI覇権への道」という記事を書きました。オープンAIの始まり、イーロン・マスクとサム・アルトマンがパートナーであり友人だった頃に遡れば、GoogleのDeepMind部門が唯一のゲームでした。世界中のAIに携わる最高の人材が全てその1つのインキュベーターにいました。
GoogleによってDeepMindは所有されていましたが、Googleのデータにアクセスできる一方で、独自の条件で運営されていました。もちろん彼らはTransformerを発明しましたが、それをチャットGPTのような製品に変える機会を逃しました。
サム・アルトマンの功績として、彼は製品をリリース、リリース、リリースする方法を知っていました。そしてMicrosoftも優れたパートナーでした。今日までのその展開は私たちが知っている通りです。
Googleはある意味で躓いているように見えました。Geminiの全体的なアイデアは、DeepMindが彼らの中核的なAIシステムに統合され、再び1つの大きな企業になったということです。しかし今や、それらのツールがGoogleの巨大なユーザーベースにロールアウトされる製品フェーズにあり、彼らの巨大なデータセットがこれからの次世代において役割を果たし始めています。
CUDAの競合製品や、独自のテンソル処理ユニットなど、彼らが昔から取り組んでいた利点の全てが、GoogleをAI企業として世界のトップに押し上げる方向で集まり始めているように感じます。
しかし、ポール・デル・シニョールが言うように、2023年2月6日、GoogleのCEOであるスンダル・ピチャイが舞台に立ち、Bardを披露した時、幻覚を見せたBardはGPT-3には及ばず、その瞬間、Googleの親会社であるAlphabetは1000億ドルの時価総額を失いました。
当時、中国の競合製品であるErnie botも多くの奇妙なことを言っていたことを覚えています。その時点で、誰もが大規模言語モデルで遅れを取っていました。しかし今は異なる世界です。
DeepMindとGoogle Brainは十分な期間統合されており、それがGemini製品です。つまり、もはやリソースを分散させることなく、これらのものが製品にどのように適合するかについてより明確な道筋があります。
画像分野では少し遅れを取っているように感じましたが、Image 3は今や通常の水準に戻っており、GoogleのVoは私が思うに世界最高のビデオジェネレーターです。Singu(シングー)やSoraと議論することもできますが、Voが最高に見えます。
また、時々私はGemini、特にその2.0 Advancedを使用し、OpenAIの4oや4o1モデルと比較しますが、それは同等かより良いと思います。数日前、長くて読みにくい契約書をGeminiに投げ込んだとき、OpenAIのモデルよりも良い仕事をしたと感じました。
したがって、彼の主張は正しいと論じることができます。眠れる巨人は2024年に目覚め、2024年末までにGoogleの完璧な革新の嵐が次のように強く打ち出されました:

Geminiモデルがチャットボットアリーナのリーダーボードでトップになりました。数学で1位、クリエイティブライティングで1位、ビジョンタスクで1位です。
Gemini 2.0、多言語推論、Book LM - 2024年で最も人気のあるAI製品
Voビデオジェネレーターが突如として登場
Image 3が素晴らしい成果を上げています。ここにImage 3でピザを食べるドラゴンがいます。
Project Astra - 複数の感覚を通して世界を理解し、相互作用できるAI
Project Mariner - Claudeのコンピュータークローンのように、ウェブを閲覧しコンピューターでタスクを実行できるAIエージェントツール
Jewel - コードベースを理解し、テストを実行し、フィードバックに適応するAI駆動のコードアシスタント
Deep Research - 複数ステップの研究計画を使用して、複雑なトピックの探索をユーザーを支援するように設計されたAIエージェント

そしてもちろん、副次的なトピックでもありそうでもないのが、Googleが開発した新しい量子チップのWillowです。
NVIDIAが巨大な独占を持っている理由であるCUDAレイヤーについて、CUDAの代替を作ろうとしている唯一の企業は長い間、おそらく8-9年以上、Googleだけでした。それは彼らのサーバーにあり、独自のもので、誰にも売っていませんが、彼らのTPUはそれで動作します。かなり印象的だと言わざるを得ません。
スンダル・ピチャイがこのGoogleの時代に適していないという予測を聞いたことがありますが、適しているかもしれません。分かりません。2025年に彼が交代させられる可能性は50-50だと私は言いますが、いずれにせよ、Googleは現在多くのものを揃えていると思います。
また、私の最新の動画「AIが偽の花火ショーで何千人もを欺く」への多くの視聴ありがとうございます。投稿からわずか10時間で既に5000回近い視聴があり、とても素晴らしいです。
ネイサン・バーナードが書いています:「社会的に操作されるリスクがどれだけあるかを教えてくれるAIがスキャムだったら面白いですね」。その通りです。そのような操作システムは「ガスライトGPT」と呼ばれるべきです。
「2回連続でAI gridの発音を間違えています。Igridaと発音するのですか?Aerdと発音するのですか?それでもいい技術コンテンツですが、ありがとう」。はい、私はおそらく読字障害があるかもしれません。正式な診断は受けていませんが。
「ねえディラン、あなたの読字障害についてより深い洞察を得るために、神経多様性のトピックを見てみてください」。なるほど、あなたは私に読字障害があると思うのですね。
「私も読字障害があり、英語教師なので、間違って読まれた言葉が目につきます。例えば、'irrevelant'を'irrevent'と発音したり、フランス語の'miffed'を'muffed'と言ったり、Cold FusionのDiogoを'Diego'と呼んだりしました」。その通りです。最後のは認めます。
「これらのことは、あなたの洞察や日々のニュースへの理解の素晴らしさを少しも損なうものではありませんが、あなたがこれらのことを知りたいと思うかもしれないと思いました」。はい、一度頭の中で間違った言葉を覚えてしまうと、それを修正するのに苦労します。
「あなたの赤目の問題の前からサブスクを始めました。それはOGですね、ありがとう、ジョー」。
私の最後の動画の書き起こしをClaude、ChatGPT、Geminiに投げ込んで、私に読字障害があるかどうか判断してもらいましょう。「以下の私のYouTube動画の書き起こしを読んで、私に読字障害があるかどうか判断してください」。はい、読字障害は単語を読むときに最も一般的です。その通りですね。おそらくそれは分からないでしょう。はい、書き間違いはかなりあります。新しい単語をデコードするのに苦労したり、読むときに行を飛ばしたりするかもしれません。おそらくそうですね。
ただし、ChatGPTは「明確な兆候は見られませんが、これは書き起こしだけなので、良い情報源ではありません。おそらくビデオを見る必要があります」と言っています。
なんと、書き起こしに基づいて、Claudeは「読字障害を示唆する可能性のある指標がいくつかあります」と言い、Geminiは「読字障害の明確な兆候はない」と言っています。
そして、私の読字障害基金を支援したい方は、patreon.com/DillanCuriousまたはYouTubeの動画下の小さな参加ボタンからお願いします。私にとってはどちらも同じです。
そして、多くの人が曲が始まると視聴をやめていることに気付きました。通常20%の視聴維持率が16%まで下がります。そこで、この曲を聞いている間も興味を持ち続けてもらえるよう、小さなカメの5つの知られざる事実を見ながら聞いてください。お楽しみください。
[音楽]
「AIグリッドの発音を間違えています。それでもいいコンテンツですが、ありがとう」
「ねえディラン、あなたの読字障害についてより深い洞察を得るために、神経多様性のトピックを見てみてください。私も読字障害があり、英語教師なので、誤読された言葉が目につきます。例えば、'irrelevant'を'irent'と発音したり、フランスの'miffed'を'mo'と言ったり、Cold Fusionの'Diego'を'go go go'と呼んだりしました。これらのことは、あなたの洞察や今日のニュースへの理解の素晴らしさを少しも損なうものではありませんが、あなたがこれらのことを知りたいと思うかもしれないと思いました。私はあなたの番組とあなたの知性の大ファンです。あなたの赤目の問題の前からサブスクを始めました。全て最高です」
さあ、購読ボタンを押して、次のAI動画でお会いしましょう。ご視聴ありがとうございました。

いいなと思ったら応援しよう!