見出し画像

サム・アルトマンが明かすO1に訪れる驚くべき変化

4,105 文字

最近ロンドンでOpenAIのデブデーがあって、そこでサム・アルトマンから推論モデルの未来について、いくつか興味深い情報が明かされたんですわ。その推論モデルというのは、もちろんOpenAIの01シリーズのことです。
01シリーズはGPT4とはまったく違うもので、長い連鎖的な出来事を推論して計画を立てることができて、めっちゃうまく機能するんです。これは、私たちがこの新しいパラダイムに向かって進んでいく中で、ずっと目にすることになる要素なんですわ。
これは新しいパラダイムなので、よく注目して見ていただきたいんです。というのも、これが私たちが向かっていく未来の形やからです。高度な計算をする際の未来のモデルはこういう形になっていくので、この分野には多くの注目が集まってるんです。
アルトマンはこう言うてます。「推論というのは、私たちが何年も待ち望んできたことの多くを実現してくれると思います。例えば、新しい科学への貢献や、より複雑なコードの作成など、物事を大きく前進させることができるモデルの能力に期待しています。OCモデルの急速な進歩を期待していただいて結構です。これは私たちにとって極めて重要な戦略的意味を持っています」
ここで彼が言うてるように、これは彼らにとって極めて重要な戦略的意味を持つものなんです。つまり、01推論モデルのセットが彼らの最優先事項であることは明らかです。
すでに申し上げたように、これが新しいパラダイムで、みんなの注目がここに集まることになるんです。GPT4は素晴らしかった、ChatGPT4も良かったですが、これまでできなかったことを可能にする推論こそが重要なんです。
アルトマンが言うたように、彼らはこの瞬間を何年も待ってきたんです。なぜなら、これまでAIが約束してきた未来のすべて、つまりヘルスケアや研究、科学、エージェントなどが、この推論モデルを基盤として実現されることになるからです。
さらに興味深いのは、アルトマンが将来のモデルリリースについても少し語ってくれたことです。例えば、01モデルの第4イテレーションとなるO4について話してます。もしあなたがAIスタートアップを立ち上げようとしている起業家なら、これから数秒のクリップに注目すべきです。なぜなら、AIスタートアップにおいて、どこに時間と労力を注ぐべきかが明確に示されているからです。
「もし私たちが仕事をうまくやれば、それは将来そんなに重要ではなくなるでしょう。一方で、モデルが良くなればなるほど恩恵を受けるような会社を作るなら...例えば、もし予言者が今日私に『O4は絶対に素晴らしくなって、今は不可能に思えることも全部できるようになる』と告げたとして、それを聞いて喜べるなら...まあ、私たちが間違っているかもしれませんが、少なくともそれが私たちの目指すところです」
「そして、もしあなたがO1プレビューが今うまく機能していない領域の一つを選んで、それを解決しようとするなら、それは次のモデルが私たちが考えているほど良くならないと仮定していることになります。これが私たちがスタートアップに伝えたい一般的な哲学的メッセージです。私たちは改善の軌道がかなり急であると信じていて、現在のモデルの欠点は将来の世代で解決されると考えています」
ここで彼が基本的に言うてることは、次世代のモデルが現在のモデルが抱える多くの問題や課題を解決するということです。だから、もしあなたのAIスタートアップがAIの手付かずの分野を狙おうとしているなら、例えばOpenAIが注力していない領域を選ぼうとしているなら、それは将来のリリースで解決されることになるでしょう。
アルトマンは以前からこのことについて話してきました。「OpenAIが私のスタートアップを殺した」というミームがありますが、基本的にO2モデルやO3モデルが問題を解決していくと考えてください。あなたが本当に作るべきスタートアップは、OpenAIが当初考えていなかった別の領域や配信レイヤーを提供することに焦点を当てたものです。これらのモデルが誰でも利用できるようになったとき、それが製品やアプリを作る上での重要なポイントになるでしょう。
「私は基本的に、現在AIに関するスタートアップを作るには2つの戦略があると思います。一つは、モデルが良くならないと仮定して、その上に小さなものを積み重ねていく戦略。もう一つは、OpenAIが同じ軌道を維持し、モデルが同じペースで向上し続けると仮定して構築する戦略です」
「私から見れば、世界の95%は後者の戦略に賭けるべきですが、多くのスタートアップは前者の戦略で構築されています。そして私たちが基本的な仕事、つまりモデルとそのツールを改善し続けると、『OpenAIが私のスタートアップを殺した』というミームが生まれるんです」
「もしあなたがGPT4の上に何かを構築していて、合理的な観察者が『もしGPT5がGPT4とGPT3の差ほど良くなるなら』と言うようなものなら、あなたのことが嫌いだからではなく、私たちにはミッションがあるから、あなたを押しつぶすことになるでしょう。でも、GPT5が遥かに良くなることで恩恵を受けるスタートアップも大量にあります。そういうものを作って、AIの進歩が私たちが考えているように続けば、ほとんどの場合、あなたは本当に幸せになれると思います」
開発者や起業家として自分のAI企業を立ち上げる場合は、GPT5、O2、O3といったモデルが現在よりもはるかに優れたものになることを念頭に置いて構築してください。つまり、もし「OpenAIがこれを解決していないから、私が解決して独り勝ちしよう」と考えているような制限があるなら、それはかなり悪い賭けだと言えます。そういうことをしないように気をつけてください。
O1の直近のアップデートについて知りたい方のために、アルトマンは非常に興味深い情報も公開しました。デベロッパーデーで5つの異なる機能が紹介されました。その中の1つは他よりも少し興味深いものでしたが、順番に説明させていただきます。
まず1つ目は関数呼び出しです。これはモデルがアプリやウェブサイトと連携して、情報の検索やデータの送信などを自動的に行えるようにするものです。これは時間を節約できて便利です。例えば、ライブの天気予報を表示したり、レストランの予約をしたりするのに余分なコーディングが必要ないんです。
次に開発者メッセージがあります。これは基本的に、モデルがアプリやウェブサイトを作る人々と直接対話して、AIとアプリをより良く連携させる方法についてのフィードバックや有用な情報を提供できるようにするものです。これによって、開発者はより速く簡単にアプリのAI機能を改善できます。
もちろん、O1の新機能としてストリーミングも導入されます。これは、完全な回答を待つ代わりに、モデルが考えた部分から順次回答を提供できるようにするものです。動画を一度にダウンロードするのを待つのではなく、部分的にロードされるのを見るようなものです。これは特に長い回答や複雑な回答を待つ場合に便利で、より早く答えを得ることができます。
そして構造化出力があります。簡単に言うと、これはモデルが単なるテキストではなく、リストやグラフ、表などの整理された形式で回答を提供できるようにするものです。これは便利です。なぜなら、追加の整理なしでアプリでデータを表示したり、スプレッドシートにエクスポートしたりする際に、AIの出力を使いやすくするからです。
そして、ここからが本当にクレイジーになってきます。私も知らなかったんですが、画像理解機能が導入されます。O1の画像理解機能は来ないと思っていた人たちにとって、これは予想よりも早く実現されそうです。アルトマンがこれについて話した方法を見ると、彼は全ての情報を明かすのを控えているようで、O1の画像理解について何か面白いものが来そうです。
「O1による新しい推論時間のパラダイムで視覚機能を...ネタバレはしたくないんですが、画像ベースのモデルで急速な進歩が期待できます」
彼が言った最もクレイジーなことの一つは、「ネタバレはしたくないが、画像ベースのモデルで急速な進歩を期待してほしい」ということでした。私のチャンネルでまもなく取り上げる予定の重要な研究の一つに、「連続時間一貫性モデルの単純化、安定化、スケーリング」というものがあります。これはOpenAIが研究を行い、最近論文を発表したものです。
彼らは基本的に、拡散モデルからこの新しい手法への移行方法を示しています。この手法では、文字通り0.1秒で極めて高品質な画像を生成できます。しかも、以前の方法と比べて計算コストが10%で済むんです。OpenAIが数日前に発表したこの論文について、私は詳細な分析を行う予定ですが、これは非常に重要な意味を持っています。
エージェントについて考えている人たちのために、今エージェントが大きな話題になっていますが、アルトマンもエージェントができることについて自分の見解を示しています。
「彼らが一貫して挙げる主な例は、例えばエージェントにレストランの予約をしてもらうことです。OpenAIを使うか、レストランに電話するかのどちらかですね。まあ、それは面倒な作業の一つかもしれません。でも私が興味深いと思うのは、人間としてはできない、あるいはしないようなことができる世界です」
「例えば、一つのレストランに電話して予約を取る代わりに、私のエージェントが300のレストランに電話して、私にとって最高の料理や特別なメニューがあるところを見つけ出すとしたらどうでしょう。エージェントが300のレストランに電話するのは本当に迷惑かもしれませんが、もし300の場所それぞれにエージェントが応対するなら問題ありません。人間にはできない並列処理が可能になるんです。これは些細な例ですが、エージェントには人間のような制限がないかもしれません」

いいなと思ったら応援しよう!