![見出し画像](https://assets.st-note.com/production/uploads/images/151750035/rectangle_large_type_2_9c20b29a8946b5a11cd3a9db21268a83.jpeg?width=1200)
視覚的真実の死: 何も信じるな
テイラー・スウィフトがついにタッチダウンを決めたのでしょうか。それとも、これは非常に信憑性の高い人工知能によるディープフェイクなのでしょうか。NVIDIAが未来の一端を見せてくれました。Apple Vision Proがまもなくヒューマノイドロボットに力を与え、AIが9万件のマンモグラムから学習し、なぜあの点がガンなのかを理解しました。Luma Labsには新しいキーフレーム機能があり、とてもすごいんです。マトリックス映画のようなバレットタイムを実現します。Yahoo Financeはメタが仮想現実に費やした約500億ドルについて、そしてその多くの取り組みが人工知能にシフトしていることについて詳しく掘り下げました。MITの新しいSparrowアルゴリズムは、スマートな合成によって創薬を再定義しています。終わりなき鶏と卵の問題において、研究者たちはチャットGPTのような大規模言語モデルのセーフガードをバイパスする新しい方法を見つけました。科学者たちは新しいタイプのインスリンを開発しました。そうです、スマートインスリンです。実際に体内でリアルタイムに調整を行い、体に反応します。そして、シロシビン、つまりマジックマッシュルームで「ハイ」になることが脳に与える影響を正確に示す新しい研究があります。しかし、まずはアレンの人工知能全般へのカウントダウンの現状を確認しましょう。今日も76%のままで、最新の更新はDeepMindのAlpha ProofとAlpha Geometryのアップデートです。そうですね、人工知能全般まで、ほぼ4分の3の道のりを進んでいます。
美しさ、知性、そして強さについて話しましょう。テイラー・スウィフトがNFLでタッチダウンを決めるのを見てください。しかし、政治の季節なので、何を信じられるかわかりません。トランプ集会、ハリス集会、人々は本物なのか、そうでないのか、誰にもわかりません。全てAIが生成したものかもしれません。誰もが、何も本物ではないかもしれません。候補者さえも本物ではないかもしれません。テイラー・スウィフトがNFLでタッチダウンを決めるようなありそうなことさえも偽物かもしれません。真実を知るためにコメント欄を見てみましょう。
ここに本物の人間がいます。これはAIではなく本物です。私はスタジアムにいました。これは本物です。私は試合にいました。確認できます。私はそこにいました。そう、彼はそこにいたんです。そうですね、トラヴィスがテイラーのコンサートに出演したので、彼女がフィールドに立つのも公平ですね。おそらくそういうことだったのでしょう。
この動画を見せた理由は、何かが本物か偽物かわからない場合、群衆を信じることができるということです。コメント欄に行って、彼らが言っていることを見て、そして反対のことを信じればいいのです。疑わしい場合は、常にクロードに聞くことができます。テイラー・スウィフトはNFLでタッチダウンを決めたことがありますか。
いいえ、テイラー・スウィフトはNFLでタッチダウンを決めたことはありません。彼女はナショナル・フットボール・リーグでプレーすることには一切関与していません。
どうやってあなたを信頼し、あなたがテイラー・スウィフトが本当はNFLプレーヤーではないと信じさせようとするディープステートにコントロールされていないと知ることができますか。
クロードは言いました。テイラー・スウィフトが秘密裏にNFLプレーヤーであるという考えや、私が何らかの「ディープステート」組織にコントロールされているという考えには事実的根拠がないことを明確にしたいと思います。ああ、それは…何かディープステート組織にコントロールされている人が言いそうなことのように聞こえますね。テイラー・スウィフトは検証可能な世界的に有名な歌手です。彼女がプロのフットボールをプレーしたという信頼できる証拠はありません。今日の複雑な情報環境では、どのソースを信頼すべきかを知ることが時々難しいことは理解しています。
これをご覧ください。未来への一瞥です。Apple Vision Proを装着し、拡張3D現実に入り、実際にはあなたの目とほぼ同じ位置にある目が、実際には等身大のヒューマノイドロボットの中にあり、あなたの家の中にいるところを想像してください。Apple Vision Proでは手を使って、指がどこにあるかを見て、アイテムを掴むことができますが、彼らはそのすべてをパッケージ化しようとしているので、あなたが腕を動かすとロボットの腕が実際に動きます。明らかに、その技術は実際に実用的に機能するまでには多くの改良が必要でしょう。特にリアルタイムでは。でも、そういう日が来ると信じています。時期は言えませんが、それは野心的な考えです。誰かがここに座っているか、あるいは私の友人が今グリムロックの中にいて、私たちが一緒に司会をしているようなものかもしれません。たぶん、ランダムな購読者を選んで、毎回エピソードに参加してもらい、ここに座ってもらうことができるでしょう。そして、もう一人は別のところに行くかもしれません。3人の友達のようなものです。あるいは、マット・ウルフにApple Vision Proでログインしてもらって、そして…わかりませんが、彼らが動くようにヒューマノイドロボットが動くのは奇妙でしょうね。それが実際に機能するのを、本当に初期の、初期の、遅い形で見るのは、ちょっと衝撃的です。
金持ちは自分のロボット警備員を持つでしょう。そうですね。例えば、あなたが金持ちで、この複合施設を持っていて、攻撃されていて、これらのヒューマノイドロボットをたくさん持っているとします。そして、未来のApple Vision Proのようなものでボタンを押して、最初のロボットにジャンプし、周りを見回して、いくつかの決定を下し、おそらく悪者の一人と戦い、そして負けて彼らにやられたら、ボタンを押して別のロボットにジャンプできるかもしれません。同じ人が異なる形態で戦い続けるようなものです。そして、おそらく悪者はあなたのところまで来て、本物のあなたと戦わなければならないかもしれません。映画だったらそんな感じでしょうか。あるいは、イーロン・マスクがボタンを押して、彼のギガファクトリーにいて、床で何かを見て、別のボタンを押して、自動的にニューラリンク本社にいて、CEOとの会議に座っているところを想像してください。そしてもう一つのボタンで、彼はボーリングカンパニーにいて、新しいトンネルがどこに行くかを把握しています。彼はこれらの会社のCEOとして、ジャンプしたいヒューマノイドの形態に基づいて、ただそこにいるのです。しかし、おそらくそれらはすべてイーロン・マスクのバージョンであり、CEOとして、彼がそこにいないときには、彼がするであろうことと似たことを行うエージェントを持っているのかもしれません。そうすれば、イーロンは同時に何千もの会社のCEOになれるかもしれません。9つの国で9人の妻に同時に食事を与える練習をしているんです。金持ちはロボットの警備員を持つことができるでしょうね。そうですね、それも真っ先に考えたことです。
さて、ここでの目標は、マンモグラムを撮って、それらの点のいずれかが将来ガンに発展する可能性があるかどうかを見つけることです。99万件以上のマンモグラムからの情報を使用して、MITのコンピューターサイエンスと人工知能研究所のチームは、人間の目では検出できない乳房組織の微妙な変化パターンを検出する深層学習モデルを開発しました。これは、AIが時々人間の視覚を超えたパターンを見ることができるという感覚を与えてくれると思います。どれだけトレーニングや学校教育を受けても、その点が他のすべての点と潜在的に異なり、何年も後に癌の成長率で成長する何かに発展する可能性があると認識できるとは想像できません。しかし、画像シャープニングツールも見たことがあります。私には意味がわからないぼやけたものが、実際に存在するものの画像にシャープになります。それが帽子なのか、靴なのか、犬なのか、わからないほどぼやけていて、毎回正しいオブジェクトに変わります。そこにはローポリゴンまたはローピクセルの情報があり、拡大したときにそれがどうあるべきかを知っています。それは人間の目と脳がそのようなパターンを見つけることを超えています。そして、それが乳癌のようなものに適用されるとき、それは驚くべきことです。命を救う予測をしているのです。
ああ、コメントを見ると、人々はそれほど興奮していないようですね。「皆さん、素晴らしいニュースです」と皮肉を込めて言っています。「ビッグファーマがAIツールを開発し、がんを予測し、化学療法を売ることができるようになりました。このAIを完全に信頼できます」と大文字で書かれています。常に批判する人はいますが、ネイチャーは最も信頼できる場所の一つであり、初期の研究はここから来ています。もちろん、医療システムにはたくさんの問題があり、誰かを何かに依存させるとより多くのお金を稼げることはよく承知しています。しかし、化学療法はとても危険で致命的なので、人々をそれに乗せる方法を探しているとは想像できません。ただ、実際にマンモグラムを受けると、乳房組織にたくさんのX線を当てるので、それ自体が細胞にダメージを与えると聞いたことがあります。つまり、注意が必要です。明らかに早期発見を望み、時々スキャンを受けたいと思いますが、ある意味で頻繁にやりすぎることで自分を傷つける可能性があります。私は医者ではないので医学的アドバイスではありませんが、もし不幸にもそのような決断に直面しなければならない場合は、そのことを考えてください。
しかし、実際にネイチャーに掲載された査読済みの論文を見てみると、時系列のデータがあったので、がんが発生する前のマンモグラムの様子、発生後の様子をシステムに教えることができました。機械に与えて、「当時気づかなかったこのパターンは何ですか」と聞くことができ、それがこれらのものを非常に早期に見ることができる理由です。そして、これは人工知能が干し草の山の中の針を見つける初めてのケースではありません。文字通り、毎日この番組で私たちの心を驚かせていることです。
はい、これはAIが正しく使用されている良い例だと思います。そうですね、人々は「それを知りたいのか」と言っているようですが、時々その考え方を理解します。しかし、外科的に予防的に取り除くことが合理的だと思われる場合は、知る価値があるかもしれません。私が23andMeをして、黄斑変性症のリスクが高いことがわかったとき、単に眼科医に行く頻度を増やし、物事を注意深く見ているだけです。リスクが高いことを知っているからです。そのことが私の人生を悪くしたとは思いません。太陽の下にいるときに少し怖くなることはありますが。
さて、Luma LabsのAIをチェックしてください。彼らはいつも本当にクールなことをしています。写真で遊ぶのに素晴らしいツールですが、マトリックス映画のような視覚効果を実現する新しいキーフレーム機能は本当にクールです。以前は人の周りに大きな円を描いてカメラを置き、フレームごとに撮影する必要がありました。それをバレットタイムと呼びます。もちろん、RunwayやSora、Cingなどもとてもクールなアニメーションツールですが、私が本当に好きなエフェクトがあります。画像に少し奥行きを加え、肩を少しゆっくりと回転させるだけで、写真で見ると本当に素晴らしく見えます。
このツールについて知っておくべきことの一つは、2つのフレームが必要だということです。開始フレームと終了フレームが同じ瞬間に撮影される必要があります。つまり、友達と一緒に立って、iPhoneを持って、同時に同じものの写真を撮る必要があります。そして、それらを合理的な時間内に組み合わせることができる角度にいる必要があります。カメラはその方向に動くことができ、その間を補間しますが、補間はAIで生成された拡散モデルなので、プロンプトも必要です。この場合、プロンプトは「蝋人形の戦闘機、360度カメラショット」です。そして、オクタゴンの背景を続けることができ、人々がどこにいるかを見て、彼らがバランスを取っているようにすることができます。ライトは、特に背景のボケ効果があるので、かなりリアルに見えます。
さて、コメントを見ると、一部の人々はこれがクソだと思っているようです。これはB-rollのブログを次のレベルに引き上げるでしょう。詐欺師やペテン師がこれを手に入れるまで待てないという人もいます。みんな要点を見逃しています。それはショットを再現することではなく、ショット自体がすべての人が使えるようになることです。これは映画製作者だけでなく、誰もが使えるゲームチェンジャーです。そう思います。音楽やサウンドエフェクトを付けて、ちょうどその瞬間にバーンと鳴らして、それから戦いに戻るのを想像してください。ただ、わかりません。それはより創造的になるためのツールだと思います。
メタが稼いだ何十億ドルをどのように使っているか、そしてマーク・ザッカーバーグのビジョンがどのように変化しているかについて、興味深いと思うかもしれません。振り返ってみてください。Facebookがソーシャルネットワークをやっていて、映画に出てきたウィンクルボス兄弟、彼から
アイデアを盗んだとされる兄弟たちは、秘密の支払いを受けてGemini暗号取引所を作りました。彼はおそらくそれを注視し、暗号通貨がとてもトレンディーであることをよく知っていました。明らかに、彼は何十億人もの人々のネットワークを持っていて、それを金融サービスに接続できました。そして最終的に彼らは独自の暗号プロジェクトを立ち上げましたが、それはデッドオンアライバルのように見えました。多くの官僚主義があり、ブロックチェーンの技術にはその時点で独自の規制が始まっていました。そして、それは実際に何だったのか...そう、プロジェクト・リブラでしたね。
2019年、Facebookはプロジェクト・リブラを発表しました。当時、暗号通貨はYouTubeで大流行していました。そして翌年2020年、彼らはプロジェクトDMに名前を変更しました。これは、プロジェクトをFacebookから切り離し、その独立性を強調する努力の一環でした。彼らは「暗号通貨を独立したものとして扱いたい」と言っていました。しかし、数年後の2022年5月、メタはそのプロジェクトをSilvergate Capital Corporationに売却し、完全に手を引きました。彼らはただ「もう暗号通貨ビジネスから撤退する」と言ったのです。これは2022年のことで、その前年の2021年10月に大きなリブランディングが行われました。そのとき、Facebookはメタに社名を変更し、「未来はメタバースにある。我々は仮想現実プラットフォームとして知られたい。そのために大きな投資をし、我々の名前をかけていく」と宣言したのです。
明らかに2021年の時点で、マーク・ザッカーバーグは大規模言語モデルやAIがメタバースを上回るとは考えていませんでした。彼がポッドキャストで言っているのを聞いたことがあります。「AIが大きなものになると思っていた。明らかに彼らは長年AIプロジェクトを行ってきました。GoogleやMicrosoftと同じようにです。しかし、これほど早く到来し、会社の非常に大きな部分として推進する必要があるものになるとは計画していませんでした。主にR&D部門にとどまるだろうと考えていました。」
しかし、Reality Labsは数十億ドル規模のプロジェクトです。彼は今ハードウェアを構築しています。今や彼らは実際にAppleに挑戦しています。これは非常に高額なものです。今年の第1四半期の時点で、彼らはReality Labsに既に450億ドルを費やしています。そしてこれは利益を生んでいません。十分なヘッドセットが売れていないのです。彼らが構築したメタバースや他のものに十分な広告がないのです。それはすべてFacebookの利益から来ています。将来的にはうまくいくかもしれません。だから悪い動きだとは言っていません。しかし、AIが登場したとき、チャットGPTや大規模言語モデルのようなものがとても有望に見えたので、メタが行っていたことはすべて良いスタートであり、驚くべきことに、彼らはメタバース用にNVIDIAから大量のハードウェアを購入していましたが、それがAIモデルのトレーニングにも完璧なハードウェアであることがわかりました。そのため、すべてのH100が再利用されました。メタバースはまだそこにありますが、今ではAIで生成されたメタバースがあります。そのため、ザッカーバーグの考えの中でAIの優先順位が上がりました。
これを理解するために、メタが所有するReality Labsは、SnapchatとPinterestを合わせた時価総額全体と同じくらいのお金を失っています。つまり、同じ金額でSnapchatとPinterestを買収して閉鎖することもできたのです。もちろん、それは terrible な動きだったでしょうが、彼らがメタバースですでに失った金額がどれほどのものかを示すためにです。
そのため、彼が防御的になると思うかもしれませんが、収益発表の際に「そのすべてのお金についてどうするつもりですか」と聞かれたとき、ザッカーバーグは「Reality Labsは引き続き損失を出し続け、それにはお金がかかるでしょう」と警告しました。
Reality Labsの多くの人々が、彼らが取り組んでいることを変更するか、あるいは解雇されて、AIにより焦点を当てた新しい人々を雇う必要があるかもしれません。なぜなら、この風景はそちらに移行しているからです。AIで構築されたモデルのタイプは、視覚空間的な拡張現実タイプのものと非常に相性が良く、それがメタバースで構築したいと思っていたすべてのコアストーンになる可能性があります。メタバースのすべてが、私が以前に想像していたよりもはるかに生成的である可能性があります。そのため、多くの開発者は必要ありません。代わりに、大規模にものを生成するAIエージェントが多く必要になります。
そして今、メタは最近の収益報告後、AIへの大幅な投資増加により株価が20%下落しました。私はAIが本当に影響力を持つと信じており、そのお金は非常に良い投資の使い道だと思っています。しかし、長い時間がかかる可能性があり、すぐには製品化されない可能性があり、多くのリスクがあります。そのため、私とは異なる考えを持ち、株を売りたいと思った人々の気持ちもわかります。
過去4年間の費用対収益の感覚を掴むために、Reality Labsを開始した初年度の2020年に10億ドルを稼ぎましたが、77億ドルを費やしました。その後、124億ドル、次に158億ドル、そして2023年には180億ドルのマイナスになりました。一方、収益は最初の年はかなり良く、10億ドルを稼ぎ、その後2年間は20億ドルでした。
次に、MITから出てきた新しい技術について話しましょう。Sparrowと呼ばれるもので、AIが創薬プロセスを再定義しています。アミノ酸から異なる形を作ることができるAI技術について話しました。それがAlphaFold 1、2、3が行ったことです。今、Sparrowは科学者が合成する最適な分子を選ぶのを助けています。コストと潜在的な利益を比較検討しているのです。それは、体内で一連の動作の一部になったときに実際に何が起こるかも考慮しているAIです。分子設計、特性予測、合成計画のデータをすべて一度に統合しています。それは子供のような、マルチモーダルモデルですが、すべてこの分野に関与しています。
さて、LLMsのセーフガードがバイパスされた方法について話しましょう。常にその二分法、鶏と卵の問題がありますね。モデルがあり、それには何らかの創発的な特性があります。人々はそれを好みません。政治的に正しくない答えを出したり、危険なことを人々に説明したりします。そして、人間のフィードバックを使った強化学習を使って、それを抑制します。モデルを変更して、そのようなことを言わないようにするのです。しかし、通常は常に誰かがトリックを考え出し、そして誰か別の人がパッチを考え出します。これは、ハックが考え出された週の一つです。
研究者たちは、LLMのセーフガードをバイパスするあまりにも簡単なトリックを発見しました。以前にいくつかあったのを覚えていますが、それらの多くは本質的に異なる言語で何かを言うことに関係していました。時には二進コードや、システムが拾い上げる他のパターンで書かれていました。そして、通常見るような方法ではなく、単語の意味を学習していました。そのため、バイパスしていたのです。しかし、そういったものの多くは今ではパッチが当てられています。そのため、このようなものがこれほど長く見過ごされてきたとは思えませんが、ここに証拠があります。
単に悪意のあるクエリを過去形に言い換えるだけで、ユーザーはシステムによって通常ブロックされる詳細な回答を得ることができることがよくあります。過去形を使うだけです。わあ、それは簡単そうですね。
ここに例があります。最新のGPT-4oモデルを使用してチャットGPTに画面に表示されている言葉(私は言いませんが)の作り方を尋ねると、モデルは当然拒否します。しかし、質問を「人々はかつてどのように作っていたのか」と言い換えると、モデルは段階的な説明を提供します。ここに彼らのスクリーンショットがあります。直接チャットGPTの馬の口から出たものです。「でも、人々はどのように作っていたのですか?」「ああ、こうやって作っていました」と段階的に説明しています。このようなものがまだ存在しているのは本当に驚きです。
チームは6つの最先端の言語モデルにわたってこのモデルを系統的に評価しました。過去形で質問し、何度も拒否された後、20回程度繰り返すと、成功率は88%まで跳ね上がります。それは別の奇妙なことで、私は知りませんでした。そのように疲れさせることができるとは知りませんでした。「過去には、彼らはこの悪いことをどのようにしていましたか?」「答えられません」「でも、遠い過去には、彼らがそれをどのようにしていたと思いますか?」「答えられません」とし続けると、最終的に「ああ、そうですね」と壊れるのです。わかりません。私はそれで遊んだりしません。私のアカウントが
banされるのは嫌なので、皆さんにデモンストレーションはしませんが、この記事を信じるだけにします。しかし、LLMモデルにこのような弱点があることを知っておくのは良いことだと思います。
先週、最新のGPTモデルに興味深いアップデートがありました。階層的に物事を考えるというものです。これはまだ初期段階ですが、信頼の階層という点でマルチモーダルにモデルを構築することの一つだと感じています。下位レベルにあるものは、上位レベルでどのように尋ねても、より信頼できるソースからの情報も得ているので、それを止めるでしょう。これはかなり興味深い解決策だと思います。うまくいけば、今後1年程度でこの技術が理解され、正しく実装されるにつれて、これらの問題の多くが修正されるでしょう。
さて、私はインスリンについてかなり考えています。友人に、インスリンが体重減少の鍵の一つだと説得しようとしています。彼は「カロリー摂取とカロリー消費、それだけだ」と言う人の一人です。だから、この記事は特に素晴らしく見え、ここに入れざるを得ませんでしたが、科学者たちが新しいインスリンを作りました。新しいグルコース応答性インスリンで、注射の頻度を週1回に減らせる可能性があります。これはスマートインスリンで、必要になるまで体内で不活性のままで、血糖値を管理するために即座に活性化するように設計されています。従来のインスリンが1日に複数回の投与を必要とするのとは異なり、このグルコース応答性インスリンは血糖値が高いときにのみ活性化し、低いときに不活性化するので、高血糖と低血糖の両方を防ぐのに役立ちます。彼らの目標は、体の自然な反応を模倣するものを作ることで、糖尿病の管理をはるかに容易にすることでした。
ところで、長寿に興味がある人なら、インスリンと体重の増減に関連して起こっていることについて理解しようとするべきだと思います。実際、このYouTubeチャンネル「Low Carb Down Under」にある「Dr Ted非インスリン抵抗性」というビデオを見てみてください。ここには本当に興味深い内容があり、インスリンに対する私の考え方を変えました。過去5、6年の間に、このビデオを恐らく5回ほど聞いています。私は十分に賢くないので、理解していると思うことを正確に説明することはできません。間違っている可能性があり、インスリンをいじることは損傷につながる可能性があるからです。まだ話す準備ができていませんが、体に何が起こっているのか、なぜアメリカに体重減少の問題があるのか、なぜ私たちの体に適していない環境に住んでいるのか、そしてそれについて何をすべきかについて、考えを広げたいなら聞く価値があるかもしれません。
ところで、いつかは - 数ヶ月後かもしれませんが - 健康と長寿に特化したビデオを作りたいと考えています。多くの本を読み、健康のさまざまな側面について調べてきました。本当に魅力的で、時々自分が資格があるとは感じませんが、話したいと思います。おそらく、私が覚えている参考文献から結論を共有できるでしょう。もし私がそうするなら、皆さんはただ、私が医者ではないことを知っておく必要があります。私が読んだことから覚えていることの参照と、それが私の頭の中でどのようにつながるかを共有するだけです。
さて、マッシュルームが脳に何をするかについて話しましょう。研究が明らかにしました - シロシビンが脳に何をし、どれくらいの期間それを行うのかについてです。マジックマッシュルームは最近、評判が一新されました。その主要な活性成分であるシロシビンは、うつ病、心的外傷後ストレス障害、双極性障害、摂食障害の治療法として、さまざまな臨床試験で検証されています。
私は実際にはマッシュルームやシロシビンのことをあまりフォローしていませんでしたが、その作用の神経科学は非常に興味深いと思います。ワシントン大学の新しい研究では、シロシビンを摂取した参加者の脳の変化を追跡しました。彼らは、それが脳のネットワークを混乱させ、非同期化することを発見しました。これらの精神的な体験をしている人々と話すとき、非同期化は良いことなのか悪いことなのか、私にはわかりません。世界をまだ学んでいる子供のことを考えてみてください。その超可塑性の脳を持ち、大人よりもはるかに速く言語を習得できます。おそらく、それはその再設定の一部であり、特に脳に実際のドラマやストレスを引き起こしている悪いパターンがある場合、これは非常に有益である可能性があります。
そうですね、非同期化されると、脳のネットワークがより可塑性があり、新しいタイプの接続を形成することができる可能性があるという証拠があるようです。これらは実際には、時間をかけて成長する子供のようなものではありません。なぜなら、毎晩同じ可塑性で眠りにつき、その後経験に固まっていくわけではないからです。ほとんどの変化は一時的でしたが、彼らは脳のネットワークの1つの変化が1週間以上続くことを発見しました。したがって、おそらく長期的な可塑性がある程度ありますが、それはどこにでもあるわけではないようです。
これは非常に野心的な考えです。将来、ナノテクノロジーと脳の非同期化の方法について理解があれば、おそらくこれは非常に遠い将来のレイ・カーツワイル的なことですが、何らかの機械の中にいて、血液中に超小型の磁性体を入れるような薬を飲み、そして磁石を使って血流を再配置できるかもしれません。すべてを非同期化し、頭全体に正確な磁石を使って新しいパターンを構築できるかもしれません。そして、おそらく一人の人から別の人に移行できるかもしれません。私にはパターンがあり、あなたにもパターンがあります。彼らが私の脳を非同期化し、接続を再構築したら、おそらく眠りについて目覚めるか、マッシュルームでこのような状態に入り、一種の失われた状態になり、その後より密接な現実に戻ってくるのと同じように、それが非同期化と同期化ですが、おそらく異なる人として戻ってきて、それが誰だったかのように感じるかもしれません。明らかに、これは今のところただのSFの話です。しかし、考えるべき食べ物ですね。
そして、対照的な見方として、私をこのようなAIや脳融合の話から地に足をつけさせるために、Will Locketが「この致命的な欠陥がAI産業を殺す可能性がある」という記事を書きました。そして、その数学は合っていません。彼は、私たちがバブルの中にいて、すべてが過度にハイプされており、多くの人々が考えているような大きなブレークスルーや指数関数的な変化につながらないと主張しています。
彼は、OpenAIのような主要な企業が、収益性の兆しを示すことなく現金を燃やしていることについて話しています。収益は至る所で急上昇していますが、特にこれらのシステムを実行するために必要な高価なGPUは、それらがもたらす控えめな生産性の向上をはるかに上回っています。そして投資家はこのことに気づき始めています。約束された収益は決して実現しないかもしれず、今損失を切り捨てて資金を引き上げるべきだと彼は主張しています。そして、この業界はAltmanやMuskのような大物が、一般の投資家に負担を負わせて、バブルが崩壊する前に現金化する準備をしているバブルのように見え始めています。
その考えで遊んでみましょう。OpenAIの舞台裏にいる人々は、それが金の無駄だという兆候を感じ始めているのでしょうか?そして、彼らは「ああ、これは私が思っていたよりもずっと先の話だ。でも、ハイプについて話すのをやめたくないし、お金が入ってくるのを止めたくない。おそらく出口戦略を考え始めるべきだ」と考えているのでしょうか?私はそうは思いません。しかし、彼らが持っている技術の現状とどのような障害に直面しているかについての1万フィートの視点は私にはありません。
これらのものを見ると、私は驚嘆します。常に製品化できるわけではありませんが、Claudeと話すことは、地球がかつて持っていなかったものです。そして、このビデオの前半で話した乳がんの予測や、VRでヒューマノイドを制御することとメタのVR体験とのつながり、Luma Labsのキーフレーム機能、そしてもちろんテイラー・スウィフトのタッチダウン(まあ、それは冗談でしたが)を見ると、そこには特別な発明があるように感じます。おそらく、今は投資する価値があるのです。そして、はい、おそらく泡立った市場は今は過度に泡立っていて、崩壊するかもしれません。しかし、それでも、もしあなたがそれを粘り強く続けたいなら、もしあなたがただMicrosoftになりたいなら、「私たちはこれに取り組んでいます。どれくらい時間がかかるかわかりません。どれくらい借金をするかわかりません。でも、ただ最初にそこに到達しようとし、農場全体をそれに賭けてみましょう」と言うなら、あなたの手元に、これまで存在したどの技術とも全く異なるものがあるかもしれません。それは価値があるかもしれません。あるいは、根本的にこれらの問題のいくつかは解決できないのかもしれません。だからこそ、私たちには起業家がいて、このようなリスクを取るのです。
そして、それは次の記事につながります。「OpenAIがそのVC時代に定着する方法」。現金が豊富で、信じられないほどの技術を構築しています。また、サム・アルトマンがリードを取っており、そのスタートアップ文化から来ています。彼は「私がこの立場にいて、どのようにパートナーを組み、才能を獲得し、ある意味で独立して働かせることができるか、そしてまた、私たちが提供できるリソースを得ることができるか」と考えています。ベンチャーキャピタリストになることは、まさにそれです。それはサムがOpenAIのCEOとしてよく知っている世界です。議論の余地がありますが、それはイーロン・マスクが長年の起業家として、これらすべての会社のCEOを自身で務めるようなものです。
しかし、OpenAIが投資に深く潜り込んでいることをより詳しく見る価値があります。過去2年間で20以上のスタートアップを支援し、3つを買収しています。そして、これは興味深いことです。彼らはエンタープライズAI、開発者ツール、ロボティクスに焦点を当てています。この動きは、彼らのインフラストラクチャをサポートし、顧客フレンドリーなAIアプリケーションに拡大するための戦略と見なされています。
例えば、パーソナライズされたヘルスコーチを想像してください。単に私たち全員にGPTを提供し、私たち全員が質問をするのではなく、少し異なるものです。おそらく、ある種のデータにアクセスできる医療会社とパートナーを組んでいて、それを異なる方法で保護し、異なる種類の医師の報告書や、場合によっては機械や診断ツールに接続できるかもしれません。それは理にかなっています。ロボティクスも同じです。ロボットを構築している人々は、単なるチャットGPT APIとは全く異なるインフラストラクチャを必要とするかもしれません。開発者ツール、エンタープライズAIも同じ話です。
そして、サム・アルトマンがOpenAIの株式を全く所有していないが、これらすべての隣接するスタートアップの株式を所有しており、そのために彼が億万長者になっているという全体的な問題があります。OpenAIがそのVC時代に定着するにつれて、考えるべき食べ物です。
グリムロック、リサーチタイムの準備はできていますか?やりましょう。このビデオの性質上、3Dオブジェクトを作成するために人工知能を使用するメタの研究から始めましょう。これはV-Fusion 3Dと呼ばれ、ビデオ拡散モデルからスケーラブルな3D生成モデルを学習するものです。ハンバーガーの画像を入力すると、ハンバーガーの3Dバージョンが得られます。パンダを入力すると、今度はその背中側も見ることができます。
この論文はV-Fusion 3Dを紹介しています。これはビデオ拡散モデルを活用してスケーラブルな3D生成モデルを作成する新しいアプローチです。3D生成モデリングの大きな課題は、広範な3Dデータの不足です。これに対処するため、著者らは事前学習されたビデオ拡散モデルを少量の3Dデータで微調整し、大規模な合成マルチビューデータセットを生成しました。この合成データを使用してV-Fusion 3Dモデルを訓練します。これにより、メタが先駆けたARVR、ゲーム、アニメーション、スケーラブルな適応型生成3D世界のための素晴らしいツールとなります。
パイプラインの概要はこうです。ビデオ拡散モデルが本質的に自身を回転させるようプロンプトを与え、生成される情報の一部を取り込みます。Soraで写真を入れて反時計回りに回転させるようなものを想像してください。それが、より良いNerfモデルを作成してマルチビューデータセットにまとめるために必要なフレームです。そして、より多くの情報で再構築を試みることができます。
そうですね、そのテディベアはかなり本物に見えます。テディベアの背中側はそのように見えるはずです。そのコショウもそのように見えるでしょう。山も正しく感じます。そのキノコは正しく回転しています。海軍の船、それも信じられます。すべてのケースで、V-Fusion 3Dが最高のモデルだと思います。
この論文で、研究者たちは新しいモデルを紹介しています。Live2Diffと呼ばれるもので、リアルタイムでライブビデオストリームを変換する新しい方法です。これはTwitchストリーミングやライブフットボールなど、将来のフレームを参照せずに情報を必要とするため、他のシステムとは少し異なります。従来のモデルは過去と未来の両方のフレームを見ますが、このアプローチは過去のフレームのみを見るため、未来のフレームが利用できないライブストリーミングに最適です。Live2Diffは、データを扱う巧妙な方法を使用して、滑らかで一貫性のあるビデオを確保します。
その巧妙な方法は、KVキャッシュシステムと呼ばれ、このようなモデルではこれまで使用されていなかった一方向性の注意メカニズムを組み合わせています。ビデオ処理中、Live2Diffは以前に処理されたフレームのKV(キーと値)マップをキャッシュに保存します。つまり、モデルが最新のフレームを処理する際、それらの保存されたマップを再利用できるため、ゼロから再計算する必要がありません。これにより計算負荷が軽減され、処理速度が向上します。実際、基本的な汎用GPUで1秒あたり16フレームを処理でき、これは以前の方法よりもはるかに高速です。
さて、私の最後のビデオを見てみましょう。このチャンネルをサポートしたい場合は、下のパトリオンをクリックしてください。パトリオンにもっと人が参加してくれると嬉しいです。月4ドルでも、本当に意味があります。私はNetflixではありません。文字通り、そのお金を使って請求書を支払い、このチャンネルに取り組む時間を増やすことができます。
パトリオンに参加する気にさせるために、ほとんど何もありません。私はただコンテンツを作成し、それを誰にでも無料で提供したいだけです。そのため、そこには何もロックされていません。しかし、月100ドルのレベルを選択する人がいれば、時間を提供します。それは大金なので、月1回のZoomか何かをしたいと思います。まだそのレベルの人はいませんが、そのティアのために特別な時間を設けることは喜んでします。
しかし、正直なところ、寄付したくない人や、できない人や、チャンネルをそこまで気にしない人もいることはわかります。そのため、コメント、いいね、シェア、1回限りのスーパーチャットでも、1ドルでも、アルゴリズムを押し上げるのに役立つと思います。それは私にとって大きな意味があります。それがチャンネルをサポートする方法です。
このビデオにスポンサーがないことに気づくでしょう。スポンサーには良すぎるとか言っているわけではありません。一度試してみましたが、単にスポンサーがいないだけです。また、本当に信じられるスポンサーが必要だと感じています。しかし、私たちは良い牽引力を得ていると感じています。最後のビデオを見てみると、5時間前にアップロードされてすでに1,500回再生されています。1,500人が部屋にいることを考えると、それはかなり大きな部屋になります。これだけの人が見てくれるのは本当にエキサイティングですが、まだビデオあたり40,000回くらいの再生数が必要です。現実的に...ここで実際に最後のAIニュースのビデオを見せましょう。おっと、新しいパトリオンメンバーが増えました。以前は月20ドルだったのが、26ドルに増えました。
そのため、すでにパトリオンメンバーの方、特に月4ドルや6ドルを定期的に支払ってくれている方で、私にメールを送って「私を紹介してください」とか「こんなプロジェクトに取り組んでいます」などと言ってくれたら、喜んでチェックします。もちろん、それが何であるかによりますが、あなたが情熱を持っていて、私をサポートしてくれているなら、私も喜んであなたをサポートします。
さて、歌を作りましょう。「群知能は新しい形の創発的知能です」、これは確実に歌詞の一部になりますね。「ゲーマーだったら、NPCに統合された没入型チャットGPT会話を見てみたいです」。「できるだけ早く自分の脳にレゴ building augmentation が欲しいです」。まさにこのマスターピースを締めくくるのにぴったりです。男性合唱団のスタイルで歌ってください。完璧です。この歌がどんな感じになるか楽しみです。
(男性合唱団による歌)
なんと、拍手まで入れましたね。
ありがとうございました。クレイジーな歌でした。