![見出し画像](https://assets.st-note.com/production/uploads/images/172655648/rectangle_large_type_2_22d82ed8657ddec98788282ebbb8fa6d.png?width=1200)
o3-mini公開に合わせて行われたOpenAIメンバーによるAMAのまとめ
Redditで行われた『AMA with OpenAI’s Sam Altman, Mark Chen, Kevin Weil, Srinivas Narayanan, Michelle Pokrass, and Hongyu Ren』でのOpenAIメンバーの回答をできる限りまとめました。Gemini Experimental 1206で抽出し、内容を確認して、翻訳は複数のツールで行いました。
「AMA」は「Ask Me Anything」の略 、「何でも聞いて」です。
Sam Altman (u/samaltman)
Q: 高度な音声モード(Advanced Voice Mode)のアップデートはありますか? これはGPT-5oの可能性のある焦点ですか?GPT-5oの大まかなタイムラインはどうなっていますか?
A: はい、高度な音声モードのアップデートが来ます! たぶん「GPT-5o」ではなく「GPT-5」と呼ぶことになると思います。タイムラインはまだ決まっていません。
Q: 再帰的自己改善は徐々に進むプロセスだと思いますか?それとも急激に加速するハードテイクオフになると思いますか?
A: 個人的には、数年前に考えていたよりも「急速なテイクオフ」の方が現実的だと思うようになりました。そろそろこの件について何か書くべき時かもしれません…。
Q: 2030年になり、ほとんどの人がAGIと呼ぶシステムを作成したとします。それはあなたが投げかけるすべてのベンチマークをクリアし、あなたの最高のエンジニアと研究者をスピードとパフォーマンスの両方で打ち負かします。さて、どうしますか?「ウェブサイトで提供する」以上の計画はありますか?
A: 私の考えでは、最も重要な影響は科学的発見の速度を加速させることであり、それが生活の質の向上に最も貢献すると信じています。
Q: いくつかのモデルの重みをリリースし、いくつかの研究を公開することを検討しますか?
A: はい、私たちは議論しています。私は個人的には、私たちが歴史の間違った側にいて、別のオープンソース戦略を考え出す必要があると考えています。OpenAIの誰もがこの見解を共有しているわけではなく、現在の最優先事項でもありません。
Q: 思考トークンをすべて見せてもらえますか?
A: はい、私たちはこれのもっと役に立ち、詳細なバージョンをすぐに表示する予定です。r1を更新してくれたことに感謝します。
Q: full O3のデビューはいつですか?
A: 数週間以上、数ヶ月以内だと思います。
Q: オペレーターのレギュラープラスプランへの移行はいつ頃になりそうですか?ロボティクス部門の最初の目標は何ですか?オープンAIは、トリリウム、セレバーズなどのより専用のチップ/ TPUをどのように見ていますか?オープンAIはそれを検討していますか? AGIとASIのある未来に備えて、何に投資しますか?最も思い出に残る休暇は何でしたか?
A: 数ヶ月。本当に良いロボットを少量生産し、そこから学びます。GB200は今のところ最高です!良いことの1つは、あなた自身の内面の状態、つまり回復力、適応性、落ち着き、幸福などです。選ぶのは難しいです!しかし、最初に思い浮かんだ2つは、東南アジアをバックパッキングするか、アフリカでサファリをすることです。
Q: 今週の大きな問題であるDeepseekについて話しましょう。明らかに非常に印象的なモデルであり、他のLLM出力でトレーニングされた可能性が高いことは承知しています。これにより、将来のモデルの計画はどのように変わりますか?
A: それは非常に良いモデルです!私たちはより良いモデルを作成しますが、以前の年ほどリードを維持することはありません。
Q: なぜo3-miniはまだ2023年10月のナレッジカットオフを持っているのですか?o3またはo3プロでも同じですか?ナレッジカットオフを更新する予定はありますか?
A: 検索を有効にしたので、これはそれほど重要ではありません。私自身の使用では、ナレッジカットオフについて考えることはもうありません。
Q: プラス層の価格を引き上げる予定はありますか?
A: 実際には、時間とともに減らしたいと思っています。
Q: プロユーザーがo3-mini-highの制限を寛大に利用できるのに、なぜPROに登録する価値があると思いますか?o3プロもすぐに登場しますか?
A: o1プロがある程度価値があると思ったら、o3プロは非常に価値があると思うはずです。
Kevin Weil (u/kevinweil)
Q: 4oイメージジェネレーターを展開する予定はまだありますか?
A: はい!私たちはそれに取り組んでいます。そして、それは待つ価値があると思います。
Q: 思考トークンをすべて見せてもらえますか?
A: 私たちは今日表示しているよりも多くを表示するように取り組んでいます。これは非常に近いうちに行われます。すべてを表示するかどうかは未定です。すべてのCoTを表示すると競合する蒸留につながりますが、人々(少なくともパワーユーザー)がそれを望んでいることもわかっているので、バランスを取るための正しい方法を見つけます。
Q: スターゲイトの成功は、OpenAIの将来にとってどれほど重要ですか?
A: 非常に重要です。私たちが見てきたすべてのことは、より多くの計算能力があれば、より良いモデルを構築でき、より価値のある製品を作ることができるということです。私たちは今、2つの次元でモデルを同時にスケーリングしています。より大きな事前トレーニングと、より多くのRL /ストロベリーです。どちらも計算能力を必要とします。また、数億人のユーザーに製品を提供することもそうです!そして、私たちがあなたのために継続的に作業を行うよりエージェント的な製品に移行するにつれて、それには計算能力が必要です。したがって、スターゲイトは、電力/ GPUをあなたのための素晴らしいものに変えるための私たちの工場と考えてください。
Q: ChatGPT-5はいつ登場しますか?
A: o-17マイクロとGPT-(π+1)のすぐ後です。
Q: オペレーターのレギュラープラスプランへの移行はいつ頃になりそうですか?ロボティクス部門の最初の目標は何ですか?オープンAIは、トリリウム、セレバーズなどのより専用のチップ/ TPUをどのように見ていますか?オープンAIはそれを検討していますか? AGIとASIのある未来に備えて、何に投資しますか?最も思い出に残る休暇は何でしたか?
A: オペレーター:日付はありませんが、コンピューターの使用は明らかに長期的なAGIの一部であり、できるだけ早くすべての人に提供したいと考えています。最初の反応は素晴らしく、オペレーターをより速く、より安価にするいくつかの特殊なモデルをトレーニングすることに取り組んでいます。これがそのためのステップです。ロボティクス:学びましょう!休暇:妻と私は以前、インド/ネパールで100マイルのレースに参加しました。素晴らしかったです。
Q: GPT-4oでリリースされる予定だったネイティブのマルチモーダル画像生成と編集はどうなりましたか?それは私が最も楽しみにしていた機能でした。
A: もうすぐ来ます!今まさに取り組んでいるところです。そして、待つ価値はあると思います。
Q: 高度な音声を使用している間、テキスト/キャンバスと対話できるようにしてください。私はそれと話し、ドキュメントを繰り返し処理させたいです。
A: はい!私たちは、ある程度独立して構築された多くの優れたツールを持っています。目標は、できるだけ早くそれらをあなたの手に届けることです。次のステップは、これらすべてを統合して、検索してPythonを実行するキャンバスを生成するときに推論するモデルと話すことができるようにすることです。すべてのツールがより良く連携する必要があります。ちなみに、すべてのモデルが完全なツールを使用する必要があります(oシリーズモデルはまだすべてのツールを使用できません)。それも実現します。
Q: o1または4oから残っている回答の数を知るための何か、プログレスバーのようなものが将来的にありますか?そうすれば、質問と使用するモデルをより適切に管理できます。
A: これはもっともな質問ですね。答えは「はい」だと思いますが、一方で、利用回数が減るという現実的な影響もあります。特に、ユーザーがカウントの減少を逐一意識しなければならない場合です。そのため、カウンターがないことには解放感があり、特に制限をどんどん引き上げられるなら、なおさらです!どうすればうまく実現できるか、アイデアがあればぜひ聞かせてください :)
Q: プラス層の価格を引き上げる予定はありますか?
A: いいえ。
Q: もうSOTAではなくなった古いモデル、たとえばGPT-2、GPT-3、Jukeboxなどをオープンソース化することを検討しますか?
A: u/spsingh04が言ったように、私たちはこれをもっと行うことを間違いなく検討します。
Q: なぜ、米国政府の核チームと協力してAIに取り組んでいるのですか?ターミネーターを見たことがありませんか?マイナーな幻覚が1つあると、そもそもなぜそれが行われたのかを尋ねるために私たちはここにいません。
A: 笑。私はこれらの科学者を知るようになりました。彼らは世界クラスの研究者に加えてAIの専門家です。彼らはモデルの力と限界を理解しており、モデルの出力を核計算にやみくもに適用する可能性はないと思います。彼らは賢明で証拠に基づいており、すべての作業を検証するために多くの実験とデータ作業を行っています。しかし、私は彼らがoシリーズモデルを使用することで基礎科学と国家安全保障が加速されると信じていると思いますし、彼らもそう言っています。私はそれについて非常に興奮しています。
Q: 学生として、PDF内のテキストを読むだけでなく、画像を分析できればいいのにと思います。図や視覚資料がたくさんあるので、これは私にとって非常に役立ちます。
A: u/AbbreviationsUsed187が言ったことを言いに来ました!(u/AbbreviationsUsed187「彼らはそれをエンタープライズ版でリリースしたばかりです。将来的にPlusにも来ることを願っています。」)
Q: エージェントは他に何を期待できますか?無料層のユーザーにもエージェントを作成して、採用を迅速化してください...。新しいdalleバージョンの最新情報はありますか?最後に、誰もが尋ねる質問... AGIはいつですか?
A: その他のエージェント:非常に非常にすぐに登場します。あなたは幸せになると思います。4oベースの画像生成:数ヶ月ほどで、あなたにそれを提供することが待ちきれません。それは素晴らしいです。AGI:はい
Srinivas Narayanan (u/dataisf)
Q: 2030年になり、ほとんどの人がAGIと呼ぶシステムを作成したとします。それはあなたが投げかけるすべてのベンチマークをクリアし、あなたの最高のエンジニアと研究者をスピードとパフォーマンスの両方で打ち負かします。さて、どうしますか?「ウェブサイトで提供する」以上の計画はありますか?
A: 私たちがAIと対話する方法は、かなり根本的に変わります。物事はよりエージェント的になります。AIは、複雑なタスクや私たちの目標について、バックグラウンドで継続的に私たちのために機能します。彼らは、役に立つときはいつでも私たちに確認します。ロボティクスも、現実世界で私たちのために役立つタスクを実行できる程度に進歩するはずです。
Q: 推論モデルにファイル添付機能を追加する予定はありますか?
A: それに取り組んでいます。推論モデルは、将来的に取得を含むさまざまなツールを使用できるようになります。
Q: 音声、ビデオ、画面共有、タスク、オペレーターなど、多くのコンポーネントがリリースされ、非常に完成度の高い自動化体験が実現されています。まだ欠けている要素はありますか?あるとすれば、それは何でしょうか?
A: はい、多くの要素が組み合わさってきています。しかし、推論能力の向上は依然として最も重要な部分です。継続的なビデオ入力・出力が実現すればとても面白いでしょう。また、ブラウザだけでなく、コンピューター全体や他のデバイスでの自動化も重要です。さらに、仕事や私生活で異なるアプリケーションを簡単に理解し活用できる能力も必要です。
Q: ビデオ機能のリリース以来、高度な音声会話機能が明らかに低下しています。これを修正/改善する計画はありますか?
A: フィードバックありがとうございます。これを調査します。
Q: 推論モデルにPDFを添付できるようになるのはいつですか?学生にとって、推論モデルの使用はその欠如によって大きく制限されているように感じます。
A: はい、それは将来的に提供されるはずです。具体的な日付はまだありません。
Q: 今日、新しいキャリアを始める必要があるとしたら、どの分野を選びますか?
A: あなたが情熱を傾けているドメインや問題領域を見つけてください。たとえば、健康を改善したり、世界のためにより多くのエネルギーを生み出したりすることなどです。それらを解決するための具体的な技術は時間とともに変化します。AIはこれらの問題を解決する上でより重要になるため、それを使用することを学ぶことが重要になります。学ぶことを学びましょう。オープンで適応性がありましょう。
Q: 将来、WhatsAppの会話を完全に自動化して、私がただリラックスできるようにするようなものはありますか?
A: もしかすると、新しいTwitchはAI同士が会話するのを見ることかもしれませんね :)
Q: 高度な音声AIでファイル添付やウェブ検索の機能をリリースする予定はありますか?
A: 12月に高度な音声で検索を開始しました。ファイルは将来的に提供されます。まだETAはありません。
Q: プロユーザーがo3-mini-highの制限を寛大に利用できるのに、なぜPROに登録する価値があると思いますか?o3プロもすぐに登場しますか?
A: 現在、o1プロモードとオペレーターもあります。プロ層では、難しいタスクを解決するためにより多くの計算を使用する方法が増え続ける可能性があります。そして、はい、プロユーザーはレート制限がないことを気に入っています:)
Q: どの主要な科学的ブレークスルーを最初にAGIに向かわせますか?
A: 病気を治すこと。より安価なエネルギーを得ること。
Michelle Pokrass (u/MichellePokrass)
Q: 高度な音声を使用している間、テキスト/キャンバスと対話できるようにしてください。私はそれと話し、ドキュメントを繰り返し処理させたいです。
A: 良いフィードバック、ありがとう!
Q: ChatGPTのメモリ機能はoモデルでいつサポートされますか?
A: それに取り組んでいます!すべての機能をoシリーズに統合することが、私たちの最優先事項です。
Q: 4oには大きな改善がありますか?カスタムGPTが本当に好きで、アップグレードされたり、カスタムGPTで使用するモデル(たとえばo3ミニ)を選択できたりすると素晴らしいです。
A: はい、私たちは4oシリーズをまだ終えていません!
Q: もし私が取り組んだり進歩させたりしたら、あなたが私を雇いたくなるような問題は何ですか?
A: 新しい高品質の評価は常に印象的です。私は、評価が大好きなユーザーと製品に焦点を当てた研究者のために私のチームを雇っています!
Q: o3-miniはツール使用の出力を備えた初の推論モデルですが、これを推論チェーン内でも機能するように拡張することを検討していますか?
A: 現在のo3-miniでは、APIで関数呼び出しを使用すると、モデルはどのツールを呼び出すかを考え、その後ツールの応答を受け取った後に再び次に何をすべきかを考えます。つまり、これは基本的に推論チェーン内でのツール呼び出しと考えることができます!この分野の改良も引き続き進めていきます。特にマルチステップの関数呼び出しのパフォーマンス向上が現在の最優先事項の一つです。
Q: AIモデルをあなたのもののようにさまざまなビジネスユースケースに実装している若いスタートアップにどのようなアドバイスをしますか?
A: ユーザーのために優れた製品を構築し、できるだけ早く動くことに集中することが最善だと思います。o3-mini +関数呼び出し+構造化出力の組み合わせは、最近のほとんどのAIスタートアップにとって優れた出発点だと思います。ユースケースをよく理解し、推論トークンの長さ+レイテンシ+パフォーマンスを最適化したい場合は、rftを検討してください!
Q: リアルタイムAPIの価格はいつ引き下げられますか?
A: 12月に価格を60%引き下げました!また、10倍安価な新しい4o-miniもリリースしました。詳細はこちらをご覧ください。これは、本番環境での使用にはかなり合理的だと思います。
私たちは常に物事を安くするように取り組んでいます!
Q: 多くの開発者と同様に、私はスピード/品質のためにコーディングにSonnetを使用しています。o3-miniはそれの代替と見なすべきですか?より広く、開発者が2025年第1四半期に期待できる具体的な情報を共有していただければ幸いです。
A: o3-miniは、コーディング/数学/その他のSTEM分野に特に優れており、非常に高速だと思います!多くのユーザーがカーソル、ウィンドサーフなどのアプリで使用することを楽しんでいるので、あなたも気に入ると思います。
Q: Whisperの開発は、OpenAIが構築している他のすべてのモデルと比較して停滞しているように見えるのはなぜですか?
A: 開発日にv3-turboをオープンソース化しました!
Q: オペレーター用のAPIはありますか?
A: 何に使いますか?
Q: モデルのコンテキストを改善するのはいつですか?
A: それに取り組んでいます!長いコンテキストは、私のチームの現在の最優先事項です。
Q: ChatGPTのOCR機能は、各モデルで向上しますか?そうでない場合、どのくらいの頻度で向上しますか?
A: 画像理解が大幅に向上した4oの新しいバージョンをChatGPTにリリースしました。リリースノートで詳細をご覧ください。
Q: o3-miniはいつ画像に対応しますか?
A: 私たちはminiに推論をもたらすことに取り組んでいます。今のところ、o1を試してみてください!
Hongyu Ren (u/Dazzling-Army-674)
Q: なぜo3-miniはまだ2023年10月のナレッジカットオフを持っているのですか?o3またはo3プロでも同じですか?ナレッジカットオフを更新する予定はありますか?
A: ナレッジカットオフの更新に取り組んでいますが、それまでの間、o3-miniはウェブを閲覧できます。プラスユーザーとチームユーザーは、o3-miniで1日あたり最大150メッセージ、o3-mini-highで週に50メッセージを利用できます。プロユーザーは、o3-mini-highに無制限にアクセスできます。
Q: プラスユーザーのo3-mini-highの制限はいくつですか?また、o3-miniの150の制限と組み合わされていますか?
A: 週に50回、o1と同じで。o3-miniの1日あたり150回の制限とは別です。
Q: 大学を卒業したばかりで、この分野に貢献したいと思っている人として、どのような方向に進むべきかアドバイスをいただけますか?あるいは、指数関数的な曲線を非常に速く進んでいるため、すでに手遅れである可能性はありますか... 👀
A: 分野は急速に発展しています。私の提案は、あなたが最も興味を持っていることに取り組み、AIと協力することで生産性を100倍にすることです。
Q: キャンバスはo3-miniでも表示されますか?
A: :eyes:
Q: o3ミニにファイルを添付できますか?現在、そうすることができません。
A: この機能をoシリーズモデルに統合することに取り組んでいます!
個人的ピックアップ
Advanced Voice Modeのアップデートがある
思考トークン(思考プロセスの詳細表示)を見ることができるようになる可能性がある
(miniじゃない)o3のリリースは数週間以上、数ヶ月以内
Plusプランの金額は上がらない、実際のところ下げたい
推論モデルにファイル添付機能が追加される可能性がある
Plusユーザーはo3-mini-highを週に50回、o3-miniを1日に150回使える
Proユーザーはo3-mini-highが無制限利用可能
Stargateプロジェクトは「OpenAIの将来にとって非常に重要」
更にこんなことも言っています。
got one more o3-mini goody coming for you soon--i think we saved the best for last!
— Sam Altman (@sama) February 1, 2025
「もう一つo3-miniの素晴らしい機能を近日中にお届けします—最後に最高のものを取っておいたと思います!」
いったい何でしょう???