次のAIのブレークスルーは、スケーリングではなく推論にある
12,689 文字
私は約1年前、「AGIはいつ実現するのか、それはどのようなものになるのか」という議論を思い出します。その際の論点の1つは、「ある時点でAIは人間よりもチップ設計が得意になり、より高度な知能を獲得するためのボトルネックの1つを解消するだろう」というものでした。そして今、私たちはそれに向かって進んでいるように感じます。前回のエピソードでは、2桁の規模の拡大について話し合いましましたが、その後サムは実際には4桁の拡大を目指していると私に話しました。
今このモデルは、これまでで最も性能が低い状態にあります。週単位で、1ヶ月前にはできなかったことが、今では非常に上手くできるようになっています。これは歴史的に見ても非常に重要な瞬間だと言えるでしょう。
ライトコーンの新しいエピソードへようこそ。私はゲイリーです。こちらはジャレッド、ハーシュ、そしてディアナです。Yコンビネーターではこれまでに6,000億ドル以上の価値のある企業に投資し、毎年数百の企業に資金を提供しています。私たちはスタートアップとAIの両方で何が機能するのかを最前線で見ています。
最近、サム・アルトマンが非常に大胆なエッセイを書き、AGIとASIが数千日以内に実現すると予測しました。月曜日に会った時、彼は直接4年から15年の間と見積もっていました。皆さんはこのエッセイを読みましたか?どう思いましたか?
はい、読みました。私たちには独特の視点があると思います。なぜなら、私たちはオープンAIの本当の始まりを最前線で見ていたからです。オープンAIは基本的にYCからスピンアウトしたのです。このエッセイを読んで興味深かったのは、これが2015年にサムがオープンAIを始めた時から話していたのと全く同じアイデアだということです。私が彼を知って以来、基本的に同じことを話していました。2015年当時、彼がこれらのことを話した時は、少し狂っているように聞こえ、多くの人は真剣に受け止めませんでした。しかし10年後の今、彼が正しかったことが分かり、実際に私たちは2015年の時点で考えていたよりもAGIにずっと近づいていることが判明し、今では全く狂っているようには聞こえません。むしろ完全に現実味を帯びています。
エッセイ自体は、私が長い間読んだ中で最もテクノオプティミスト的なものです。彼が予測している変化は非常に大胆です。宇宙コロニー、気候問題の解決、知能の向上、豊富なエネルギーの実現など。基本的に、人間の知能が物理学のすべてを解明できるという考えに基づいて、スタートレックのような未来を予見しているのです。
サムは常にそのような考えを持っていました。オープンAIを立ち上げた当時、彼の動機の1つは、AGIが実現すれば基本的に人間よりも科学的な研究が得意になり、あらゆる科学分野での進歩を加速させるだろうという信念でした。これは最初からの動機の1つであり、01にも深く関連していると思います。
サムが1年前に私たちのバッチで講演した時、これはO1が公に発表される前で、オープンAIで秘密裏に開発されていた時期ですが、彼が最も興奮して話していたのは、GPTにより高度な推論能力を与えることでした。これが重要だと思う理由は、科学を実際に行い、技術進歩を加速させる能力に欠けているものが、物事を考え抜く能力だからです。
O1に関して特に興味深かったのは、その能力と将来の可能性について述べた論文の1つを読むと、チップ設計で非常に優れた性能を発揮すると書かれていることです。約1年前、AGIについての議論の中で、「ある時点でAIは人間よりもチップ設計が得意になり、より高度な知能を獲得するためのボトルネックの1つを解消するだろう」という主張がありました。そして今、私たちはこれまでにない方法でその道筋に向かっているように感じます。
ディアナがその具体的なデモを見せてくれる予定です。私たちはオープンAIとハッカソンを実施し、サムが来て優勝者を審査しました。参加者の1人は実際にチップ設計を行っていました。この会社はダイオードコンピューターといい、以前も言及したと思いますが、彼らが構築しているのは基本的に回路設計のためのAIデザイナーです。
彼らの以前の製品では、PCB設計の4つの主要なステップを扱うことができました。これらすべてに多くの専門知識が必要です。システム設計、つまりアーキテクチャをどのように組み立てるか、抵抗器やセンサー、特定の処理ユニットなどのコンポーネントをどのように設計するか、そして配置のためのレイアウトとスケマティック、そしてルーティングです。ルーティングはNP完全問題として知られています。回路基板に異なる層があると干渉が発生するためです。これが、NVIDIAやIntel、Appleが無数の電気技術者を抱えている理由です。
GPT-4までは、この会社はいくつかの制約を設定し、人間が設計しなければならないスケマティック設計の多くを自動化することができました。必要なコンポーネントの選定、設計、そしてある程度のルーティングまでできました。シンプルでしたが、その時点でもかなり素晴らしかったのです。しかし、O1で彼らが実証したのは、システム設計とコンポーネント選択も行えるということでした。これは驚くべきことです。すべてのデータシートを読み込んで適切なコンポーネントを選択できるのです。
製品の使い方としては、「心拍数モニターと加速度計、マイクロコントローラーを搭載したウェアラブルデバイスを作りたい」というような高レベルな要求を出すと、この制約を考慮してデータベースを検索し、特定の加速度計、マイクロコントローラー、心拍センサーを一致させて接続し、最終結果を出力することができます。
今日私たちが作ろうとしているのは、例えばWhoopのようなウェアラブル心拍数モニターです。O1は素晴らしいのですが、欠点の1つは少し遅いということです。そのため、実際にはO1が生成できるシステム図をキャッシュしていました。かなり良いものができています。USBCコネクタ、要求通りのIMU、心拍センサー、そしてマイクロコントローラーがあります。
これからPCBの作成方法をお見せしましょう。プロジェクトを構築していきます。この出力はコードです。実際にはArelという電子SSコード言語を使用しています。ブロック図のすべてのブロックを、私たちが望むように正確に接続していることがわかります。次のステップでは、基板のレイアウトを生成します。
こちらが基板です。かなり良いできばえです。例えば、USBタイプCコネクタを少し移動するなど、いくつかの微調整が必要です。基板の形状を変更することもできます。しかしこれらがすべてのコンポーネントです。そして、私たちが構築したシステムのおかげで、この特定の基板に自動ルーターを呼び出して、完全に機能するプリント基板を手に入れることができます。
これは実際にO1論文の例の1つで、EDAを行うというものでした。しかし、彼らはさらに一歩進んでいます。論文でのEDAの例は、回路設計のためのツールセットを説明しており、スケマティックの設計、シミュレーション、バグの検証を行います。選択して書くよりも検証する方が簡単です。この会社は実際に論文を超えて一歩先に進みました。論文は主に検証とシミュレーションの最終段階を扱っていたからです。
異なるタスクと異なるワークフローで異なるモデルを使用する興味深い例だと思います。正しいコンポーネントを最初から選ぶためには、おそらくPDFドキュメントのような非構造化データを構造化された形式に変換するRAGが必要で、それを40ミニが使用してデータを抽出し、O1用のフォーマットに変換していると思われます。これは、私たちが見ている多くの興味深い製品で見られる非常に一般的なパターンです。異なる種類のモデルを使用しています。はい、PDFの抽出には40ミニを使用し、推論にはO1を使用しています。なぜなら、部品の選択は実際に非常に難しいからです。ジャーも多くのハードテック企業と仕事をしていますが、サーボやモーター、センサーなどの選択には、人間でも多くの考察が必要です。
この例で興味深いもう1つの点は、O1が登場する前のバッチで、ダイオードはGPT-4でこれを試みましたが、まったく機能しませんでした。そして基本的に同じプロンプトをO1に与えたところ、突然機能し始めたのです。つまり、本当にステップ関数的な能力の解放があったのです。彼らが私に見せてくれた時、大きな笑顔を浮かべていました。彼ら自身も非常に感銘を受けていました。
偶然にも、ディアナが運営したこのハッカソンは、非常に興味深いコンセプトでした。ほとんどのハッカソンは、人々が後で捨てるようなものを作るだけですが、このハッカソンの素晴らしい点は、実際のYC出資企業で、実際のビジネスを持ち、資金を得て、実際のユーザーを持つ企業が、実際のユーザーにリリースする予定の実際の機能を構築していたことです。O1が実際の企業にどのような機能を解放したのかを見るのは、おもちゃのプロジェクトではなく、本当に素晴らしいことでした。
推論に関してO1と似たような例がもう1つあります。ハーシュ、あなたはキャンパーと一緒に仕事をしていましたよね?キャンパーについて教えてくれませんか?
基本的にキャットのためのDevですが、自然言語だけでキャット設計を作成することができます。入力するだけで、キャット設計を出力してくれます。
時速50マイルで最適化され、5度の迎角で最小抗力係数が15の翼型を5つ設計できますか?これは非常に具体的です。通常、これには実際に機械エンジニアがすべてのシミュレーションを実行し、方程式を解く必要があります。点滅して見えるのは、4つのシミュレーションを同時に実行しているからです。基本的にはソリッドワークスのコパイロットのようなものです。
実際、彼らは最初、これをソリッドワークスのプラグインとして構築する予定でしたが、さらに技術的に難しいアプローチを選びました。これは単なるデスクトップで実行可能なファイルで、ソリッドワークスを開いて、人間のふりをしてUIをクリックし始めます。
先ほど数学のトレースが点滅したのを見ましたが、とても素晴らしかったです。O1は実際にこれらすべての方程式、これらすべての偏微分方程式を書き、基本的にナビエストークス方程式を解いて翼型を実際に解くことができたのです。
前回のエピソードでは、2桁の規模の拡大について話し合いましたが、その後サムは実際には4桁の拡大を目指し、1兆ドルの支出を目標にしていると話しました。かなり野心的ですが、その一方で、それがどこに向かうのかは想像できます。翼型は非常に印象的で複雑ですが、2024年の現時点で私たちができることの1つです。それを物理学の本質を理解することに抽象化できると想像できます。おそらく現在のO1のバージョンではそれを見るのは難しいかもしれませんが、スケーリング則が成り立つなら、室温核融合のようなより困難な工学的課題も全く現実味を帯びてきます。これらはすべて究極的には工学的な流体力学の問題があり、天気予測や他の複雑な物理現象など、解決が非常に困難で基本的にPhDが必要なものがたくさんあります。サムのエッセイでは、このようなチェーン・オブ・ソートと推論の方向にO1が向かっているという示唆がありました。特に「インテリジェンスのバイブス」を訓練するという新時代について述べられており、O1の論文では、正解を得ただけでなく、そこに至るすべてのステップにフィードバックを与えることができるという発想が示されています。基本的にモデルに考え方を教えているのです。
キャンパーの人たちも言及していましたが、推論のトレースがあり、おそらく各出力の様々なステップを振り返って微調整し、モデルが望む通りに考えるようにすることができます。1年前のAGIに関する議論は、正しい答えを出力するだけではなく、モデルにより良い考え方を教えることができるようになった時に何が起こるのかということに向かっていました。そしてスケーリング則について言えば、これは問題に計算能力を投入するためのさらなる余地を与えています。基本的に推論段階で計算能力を投入し、人間の科学組織から期待されるように、より多くのお金とより多くの時間をかけることで、反復的により良い結果を得ることができます。
ディアナ、O1のアーキテクチャと、どのように作られたのかについて話してもらえますか?その多くは、オープンAIの始まりから長年取り組んできたことから着想を得ていると思います。インスピレーションの1つはDOTAでの作業だと思います。
オープンAIがGPTで有名になる前、テック業界で知られていた唯一のことは、ビデオゲームの競技会で勝利したDOTAでした。これが彼らの最初の大きなブレークスルーでした。面白いことに、当時DOTAは世界を席巻するようなものではありませんでした。おそらく研究コミュニティだけが知っていて、実用的なものではありませんでした。しかし、最高のDOTAプレイヤーの多くを打ち負かしたことは印象的でした。
DOTAは、リソースと計画の複雑なゲームです。彼らはそこに多くの強化学習型のテクニックを実装しました。これは初期のアルファ碁やアルファゼロが囲碁を解いた方法からもインスピレーションを得ていたと思います。単に力ずくで解くのではなく、報酬関数を持ち、それに向けて解こうとしていました。Q学習についてこれほど話題になっているのはこのためです。これがRLの背後にあるアルゴリズムファミリーの基本的なアルゴリズムだからです。
DOTAのおかげで、彼らは強化学習が非常に得意になりました。動作させる方法は、自分自身と100万回ゲームをプレイさせることでした。では、それはO1にどのように関連するのでしょうか?
ここで大きなステップ関数があると思います。GPTファミリーのモデルにそれを組み込む方法は?GPTは次のトークンを予測し、パターンを生成し、結果が正しいかチェックすることに基づいています。多くは、事実に基づいた正しいデータをモデルに投入し、トレーニングし、出力について少し推論し、正しいことを確認するための報酬関数を持つ必要があったと思います。おそらく、その種のデータソースに関して多くの興味深い手法を行い、多くの秘密のソースがあるはずです。おそらく1つの推測として、数学の問題や科学の問題など、非常に事実に基づいた正確な情報を多く使用したのではないでしょうか。
スケーリング則についてゲイリーが指摘した点で興味深いのは、多くの人々が次のモデルのスケールアップ、つまり現在トレーニング中で近々リリースされるGPT-5シリーズのモデルに注目していることです。しかし、この別の方向性がどれほど大きな解放になるかを過小評価しているかもしれません。並行して探求されている2つの研究方向があります。1つは基礎となるLMの単純なスケールアップで、もう1つはこのO1の方向性です。これは全く異なる研究方向で、実世界で実際に物事を行いながら強化学習を行い、それを改善していくというものです。
これまでにリリースされたバージョンはまだO1ミニだけです。申し訳ありません、O1プレビューです。実際のパフォーマンスを見ると、このハッカソンで信じられないような結果を可能にしたO1プレビューよりも、まもなくリリースされる完全なO1モデルは大きなステップ関数の向上を示しています。サムは先ほど、O2とO3もすぐ後に続くと話していました。そのため、人々はこの解放がどれほど大きなものになるかを過小評価しているかもしれません。
O1もまだかなり不透明です。ビジネスの観点から見ると、これは新しい方法です。彼らは大きなコストをかけて、チェーン・オブ・ソートをトレーニングするための新しいデータセットを実際に作成しました。基本的には、タスクXが与えられた時にそれを部分に分解できるかという巨大なデータセットです。面白いことに、これはJakeヘラーがケーステキストで発見したことと共鳴しています。LLMに与えたタスクが幻覚を見たり、望む出力を一貫して提供しない場合、その特定のプロンプトに多くのことをさせようとしているのです。ステップに分解する必要があります。
面白いのは、Jakeの処方箋が実際に2つの部分からなっていることです。1つはステップに分解することで、もう1つは評価です。O1では、チェーン・オブ・ソートがワークフローを置き換えるので、自分でステップに分解する必要がないかもしれませんが、評価はまだ非常に重要です。Jakeヘラーとのエピソード以降、YCの卒業生から連絡があり、そのエピソードのおかげで非常に大きな何かを解明できたと言っています。多くの人々が本当にプロンプトを生のまま使用していたのです。
ハーシュ、あなたが一緒に仕事をしている会社で、100%に到達した例がありますね?Jakeが推奨したように、大きな評価セットを持ち、推論パイプラインの各ステップを非常に慎重にテストすることで実現しました。
私が現在持っている理論の1つは、それをMOEに重ね合わせると、今みんなが自問している主要な質問の1つになります。GPT-5が来て、2桁、あるいは4桁の規模の拡大が、1兆ドルの支出という形で来ようとしています。これはかなり野心的です。ラッパー企業として、あるいは垂直SaaSを構築しようとしている場合、あるいは自分のビジネスを構築しようとしている場合、何をすべきでしょうか?
私の理論では、それはイベントです。10,000のテストケースを書くことです。一般的に入手可能ではない独自のデータにアクセスする唯一の方法は、文字通り企業営業を行い、埋め込まれ、時には本当に退屈な仕事、時には本当に複雑で難解な仕事に「アンダーカバー」で潜り込むことです。売掛金管理から財務会計や会計調査まで、本当に容易には入手できないすべての分野です。
インターネット上で公開されている消費者向けのものはすべて、基本モデルに含まれると主張することもできます。そのため、あなたのMOEは最終的に、オンラインにまだない他のすべてのもの、つまり、ケーステキストが弁護士であることや、科学や翼型の構築など、何らかのユースケース、何らかの垂直分野で独自のデータを見つけ、その10,000のテストケースの評価を構築することができる場所です。これが実際の価値です。これは単なる理論ですが、そういうことになるかもしれません。
スタートアップにとって、あなたが今言ったことすべてに基づいて興味深い示唆があります。顧客の中から、最終的な10%の精度の向上に多くの支払いをしてくれる人を選ぶ価値があるかもしれません。キャンパーは実際に良い例です。趣味の人や、プロトタイプを作りたい人、何かを素早く立ち上げたい人の間で、このようなテキストからCAD設計への関心は多くあります。しかし、文字通り飛行機の部品を設計するような市場セグメントもあり、そこには誤差の余地がありません。
O1は今、プロトタイプを80%程度まで到達させることを非常に容易にしましたが、最も強力な技術チームには、100%の精度を求め、それに対して多くの支払いをする顧客セグメントを追求するオプションがあると思います。
最後まで行くことが重要です。興味深いのは、O1やAI一般が実際に多くの技術を商品化し、強力な技術チームであることの重要性を低下させるという主張がされることです。しかし、それはありそうにないように思えます。逆のように見えます。おそらくすべての価値は、最も強力な技術チームによって獲得されるでしょう。彼らは基本レベルの技術の上に構築し、最後の10%を獲得することができます。
ゲイリー、それはプロンプト、評価、そしてUIレイヤーとその周りの統合だと思います。プロンプト自体は、企業が採用するための製品ではありません。キャンパーの場合、既存のツールに実際に統合し、よく考えられたUIとワークフローを持ち、プロンプトを有用にするためのすべてのツールを持つ必要があります。
そして、それは配布です。実際にどのように人々の前に出るのか、ブランドを確立し、そして完全に良いムートは実際に切り替えの難しさです。すべてのデータを持ち、それが機能し、10,000ドルや100,000ドルのACV、時には100万から1,000万ドルのACVを支払っている場合、切り替えは非常に困難になります。従来のすべてのムートがまだ適用されます。これはまだソフトウェアですが、この能力を解放することができ、これは重要な瞬間です。
評価の重要性を強調するもう1つのポイントは、O1の世界でもそれが適用されることです。創業者たちはその上に最高の製品をどのように構築するかを考えています。O1はそれを変えるのでしょうか?Jakeヘラーとのエピソードで議論したすべてが適用されます。
ジグルはハーシュとゲイリーが一緒に仕事をしている会社ですね?彼らが何をしているのか教えてください。
完全な背景を説明すると、私たちは全く異なるアイデアで彼らに資金を提供しました。インドの創業チームで、元のアイデアはインドの高校生がアメリカの大学に出願するのを手伝うという非常にニッチなものでした。しかし、彼らは非常に優秀なAIエンジニア、研究者でした。
そして、こんなことになりました。私たちは「これは良いアイデアではない。AIは世界を変えつつあり、大学で行っていたAIの研究は、LLMモデルの微調整に関連している」と言いました。最初はAIバージョンのインドの高校生の支援でさえありませんでした。典型的なYCのストーリーで、これら2人が明らかに優秀なエンジニアで、アイデアはまったく気に入らなかったのですが、とにかく資金を提供して、何か良いことが起こることを期待しようと思いました。
彼らが実際にピボットしたアイデアは、最初はシードラウンドを調達した時点で、企業がオープンソースモデルを微調整して、同等のパフォーマンスを得られるようにすることでした。当時は本当にオープンAIだけでしたが、一般的に私たちが発見したのは、これらは良いビジネスではないということです。モデルのコストが下がり、オープンソースモデルのパフォーマンスが向上したため、人々が思っていたほどの微調整は必要なくなりました。モデルは単に良くなり続けているからです。
これはAGIに関する異なる方向に賭けているようなものです。これらのモデルが良くなり続けることを信じ、多くの微調整が必要ないと考えることです。
そこで彼らは再びピボットを行い、「AIに関して私たちは本当に得意になった。これらのモデルからパフォーマンスを引き出すのが得意だ。では、その垂直的なアプリケーションを見つけよう」と考えました。そして、AIカスタマーサポートに進みました。これは競争が激しい分野ですが、非常に技術的なチームであれば、他のチームに対して比較優位を見出すことができると思います。
カスタマーサポートの問題は、非常に曖昧な問題を扱っているということです。エッジケースが非常に多く、カスタマーサポート担当者として起こりうることの空間は膨大です。競争が激しいように見えますが、実際にはほとんど採用が進んでいません。世界中のカスタマーサポート担当者がAIに置き換えられているわけではありません。私たちはそれが起こることを見通せますが、まだ起こっていないのです。そのため、その観点からは広く開かれています。
私がジグルチームと最後に話した時に分かったことは、採用が進まない理由の1つは、単純なケースのほとんどにはルールベースのシステムが十分に機能するということです。複雑な問題を解決できるAIを構築できるという信頼や信念がありませんでした。そのため、AIカスタマーサポートエージェントを提案された企業のほとんどは、「最も時間のかかる難しい問題を完全に解決することはできない。そして、他のすべてのことにはルールベースのシステムが完全に機能している」と言っていました。
最初にこのアイデアを提案した時、人々は「これはオーバーキルだ。ルールベースのシステムで十分だ」と言っていましたが、もはやそうではないようです。なぜなら、今では本当に重要な顧客を獲得しているからです。ゼプトが新規に契約を結びましたね。
前回、彼らとオフィスアワーを行った時、1日30,000件のチケットを自動化していると言っていました。ゼプトには1,000人以上の人々がこれらの30,000件のチケットに対応していました。1日30件のチケットです。興味深いのは、一方で、これは率直に言って、AIについて考える時に誰もが少し心配することの1つです。これらの仕事は無くなるのでしょうか?
ゼプトのカスタマーサポートの仕事について興味深いのは、それが非常に楽しくない仕事で、離職率が数ヶ月程度だったということです。ほとんどのカスタマーサポート担当者は6ヶ月以下しかそこで働きたくないのです。これは実際に、何かが信じられないほど単調な場合の興味深い例です。文字通り、バターを渡すような仕事を置き換えているのです。これらは時として本当に良い仕事ではありません。願わくば、これらの人々が、ゼプトの注文が間違って配置されたことを謝罪するよりも、もっと素晴らしいことに時間を使えることを願います。
しかし、彼らがO1で発見した驚くべきことは、ハーシュが指摘したように、O1以前の実装はGPTプラスルールなどで、ほとんどのケースを処理することができず、約70%のエラー率がありました。しかし、ハッカソンの間にJakeヘラーが説明した手法を使って、評価に本気で取り組み、O1を使用することで、エラー率はわずか5%になりました。これは桁違いの改善です。
他の列も信じられないほどです。非常に複雑で、多くの時間がかかり、解決するのにコストがかかることは、基本的に0%でした。これは彼らが販売する際に遭遇していたことです。多くの人々が「実際に自動化したいのは、これらの複雑なエッジケースで、多くの時間を浪費している」と言っていました。彼らはそのようなことは全くできませんでした。しかし今では15%になっています。これはO1プレビューだけでです。
それは15%のエラーなので、今では85%の精度があります。0%の精度から85%の精度に向上したのです。
ここで興味深いのは、これはまだO1ではなく、O1プレビューだということです。そして、これは非常に新しい手法なので、彼らは現在、その優位性を守ろうとしています。チャットGPTでO1を使用すると、何が起こっているかを教えてくれるように見えますが、明らかに、ステップに分解しているという印象を与えるために結果を出力する偽のモデルを持っています。彼らはまだ他の人々にそのデータへのアクセスを与えたくないため、それを隠しているのです。
しかし、次のステップは解釈可能性、直接性が必要なように思えます。そのためにはO2がそれを持つ必要があるかもしれません。作業を見せて、ステップを見せてほしいのです。そして、「ああ、その第3ステップ、これを再実行できますか?ただし、このように分岐させたい」とか「編集したい」というようなことができるようになります。これが次の解放の1つになると思います。
現在、計画を出力し、チェーン・オブ・ソートを持っていますが、編集することはできません。今、O1が問題を解決するために必要な15のステップを出力し、各ステップを編集できるようになることを想像してください。そうすれば、Jakeヘラーの次のスーパーファインチューニングのレベルに到達します。
これは、これらのモデルが今この瞬間、最も性能が低い状態にあるということです。文字通り週単位で、1ヶ月前にはできなかったことが、今では本当に上手くできるようになっています。これは歴史的に見ても非常に重要な瞬間のように聞こえます。
私たちは、このモデルの改善からこの波の恩恵を受けるような種類の企業やアイデアについて多く話してきました。O1について、反対に、O1からあまり恩恵を受けていない、おそらくピボットすべきかもしれない種類のアイデアはどのようなものでしょうか?O1、O2、O3の改善によって廃れてしまうかもしれないものは?
完全にピボットすべきとまでは言いませんが、AIコーディングエージェントやAIプログラムエンジニアを構築している企業は、考えるべきことがあると思います。なぜなら、特にO1はプログラミングの問題を解決することにおいて優れているようだからです。私が以前働いていたチームの多くは、このようなチェーン・オブ・ソートのインフラストラクチャに多くを投資してきましたが、今やO1は実際には彼らにとって飛躍的な進歩ではありません。彼らはすでにそれに投資してきたのです。
これは、チェーン・オブ・ソートが不透明な性質によるものかもしれません。それが指示可能になれば、それが実際に、現在でさえユーザーやセンが苦労していることです。特定の道筋に進み始めると、物事を変更することができません。「このようにするか、あのようにするか」と尋ねてほしいと思いますが、現在のすべてのシステムはそれに少し苦労しています。
ディアナ、逆の質問をしようと思います。各新しいモデルの能力は、新しい一連のスタートアップのアイデアを解放します。1年前には、AIエージェントが電話で話すようなスタートアップのアイデアは機能しませんでした。多くの企業が試みましたが、すべての企業が失敗しました。夏の間にそれは本当に機能し始め、過去数バッチのトレンドの1つとして、電話に関連するものはすべて今爆発的に成長しています。なぜならモデルがついに機能するようになったからです。
この新しいO1シリーズのモデルで、どのようなスタートアップのアイデアが可能になったのでしょうか?サムのエッセイに関連して言えば、物理的な世界、原子の世界をより良くするものの多くです。なぜなら、数学と物理学が本当に得意だからです。機械工学、電気工学、化学工学、生物工学など、これらすべての分野で働くスタートアップは、デモで見たように本当に解放されていると思います。
これは興奮することです。人々のクリックを少し早くするのを手伝うだけではなく、実際に全ての人のために実世界の豊かさを生み出すものでなければなりません。そして、それは少しレースのようなものかもしれません。今、社会にはAIへの恐れがありますが、技術者たちがこの豊かさの時代をより早く導くことが求められています。そしてそれができれば、恐れよりも豊かさが勝利するでしょう。
これで今週のライトコーンは終了です。また次回お会いしましょう。