OpenAIの秘密プロジェクト『JAWBONE』|エージェント展開の始まり?
7,159 文字
OpenAIが新しいプロジェクトについての発表を準備しているようです。コードネーム「JAWBONE」と呼ばれるこのプロジェクトは、AIエージェントの展開の始まりのようです。これらのAIアシスタントは、自律的に長期的なタスクを実行することができます。各AIアシスタントは、あなたの可能性を広げる新しい手足のようなものです。
Toreさんに感謝します。こちらが具体的な内容です。ご覧のように、特定の時間に実行されるタスクがあります。例えば、毎週土曜日の午前12時などです。全てのタスクを表示したり編集したりすることができます。名前、指示、スケジュール設定、通知の受信方法などがあり、デスクトップ、モバイル、メールで通知を受け取ることができます。毎日、毎週、毎年など、任意の時間に繰り返し実行するように設定することもできます。
これはベータ機能で、まだアクセスできません。まだ噂の段階なので、慎重に受け止める必要があります。OpenAIはまだ正式に発表していないので、全ての情報は慎重に扱う必要があります。ただし、一部のユーザーがすでにこの機能を目にしているようです。
testing catalog.comによると、ChatGPTがまもなくタスクスケジューリングという新しいベータ機能をサポートする予定だとのことです。Alex Shabanovの投稿によると、OpenAIは「JAWBONE」というコードネームで新機能「Tasks」の開発を進めており、OpenAIの12日間の間にベータ版としてリリースされる予定とのことです。このTasks機能により、ユーザーは特定のプロンプトを後で実行するようChatGPTにスケジュールすることができます。
コード内の情報によると、最大2年先までスケジュールを設定することができ、これらのスケジュールされたタスクは繰り返し実行することも可能です。例えば、testing catalogからのAIニュースを毎朝送信するようなタスクを設定できます。現在、make.comやzapierを使用してこのような設定を行うことは可能ですが、ほとんどの人はそれを行いません。これによって、そのような開発がはるかにアクセスしやすくなり、エージェントへの第一歩となります。
testing catalogのTwitterは実際にフォローする価値のあるアカウントです。しばらくフォローしていることに気付きました。先ほど述べたように、Tasksベータ版では、ユーザーがこれらのタスクをスケジュールすることができ、これらの自動化は「JAWBONE」という新しいモデルツールによって処理されます。設定には通知タブも用意される予定で、スケジュールされたタスクに関する通知の受け取り方を制御できるようです。
興味深いことに、同様の機能がGeminiでも開発されているとのことです。両者が同じ日にリリースされる可能性はどのくらいでしょうか?Googleは徹底的な対抗策を取っているようです。以前は、OpenAIがGoogleの発表と同じ日により優れたものをリリースし、人々が笑うような状況でした。しかし、Googleはもうそれで十分だと考えたようです。彼らが開発しリリースしているものは非常に競争力があります。V2は一見するとSoraよりもはるかに優れているように見えます。完全にリリースされ展開されれば、詳細な比較を行う予定ですが、Googleは本気です。
同様の機能を展開しているようで、スケジュールされたプロンプト機能がまもなくGoogleユーザーにも展開される可能性があります。後で詳しく見てみましょう。この記事によると、この機能は「JAWBONE」というコードネームで開発されており、しばらく開発が続けられていたとのことです。モデルレベルで有効化される可能性が高く、モデルがこのツールの使用方法を学習する必要があります。また、ユーザーインターフェースも用意され、既存のタスクの表示、一時停止、削除、編集が可能になります。
ユーザーは余分な手間をかけることなく、ChatGPTに直接タスクの作成を依頼することができるようです。今週初めに発表されたフォルダ機能は、私がプロジェクトのようなものと考えているものです。基本的に、左側にこれらのプロジェクトフォルダを作成し、その下に特定の情報を整理できるというアイデアです。例えば、家のメンテナンスというフォルダを作成し、エアコンフィルターの交換時期や庭の雑草を抜く時期などのスケジュールをアップロードできます。その後、「今週やるべきことは何?」というような質問をすることができます。
それ自体も素晴らしいですが、その中でタスクを作成できるようになると、さらにパワーアップします。例えば、テキストメッセージを送信することができます。テキストメッセージを送信できるかどうかはまだわかりませんが、以前はzapierでそのような設定ができました。しかし、確実に何らかの通知機能を持つでしょう。ChatGPTを通じてか、他の方法かは分かりませんが、最終的にはテキストやメールなどと統合されるでしょう。「これをやる時期です」「これを忘れないでください」というような通知ができるようになるはずです。
私個人としては、このようなランダムにスケジュールされたタスクの整理に苦労してきました。毎日ではなく、隔週や月1回のような場合、何が起こるのかを覚えて対応するのが難しいことがあります。カレンダーやスケジュール管理アプリは、ある程度は役立ちますが、そこでは実際に全ての情報を処理し、追加し、非常に具体的に追加する必要があります。
ここでは、全ての情報が記載された文書をアップロードし、「エアフィルターの交換頻度を把握して、それを思い出させてください」と言うだけです。また、それらのエアフィルターがAmazonから4個パックで4ヶ月ごとに届く場合、Amazonからエアフィルターパックを購入することも思い出させてくれます。Googleカレンダーでクリックしてそれらの日付を設定するのは、難しくはありませんが、時間がかかります。ここでは1、2文を言うだけで、AIの魔法のようにそれが現実になります。このようなことを行う際の摩擦がはるかに少なくなります。
それだけでなく、これらのモデルが改善され、あなたについてより多くを学び、よりエージェント的になるにつれて、これがどんどん良くなっていくことが分かります。もちろん、GoogleとGeminiも非常に似たものを展開しているようです。
カスタムGemsを作成する機能があるようです。Gemsは、カスタムGPTsに似ており、GPTsのバージョンです。スケジュールされたプロンプト、つまり特定の時間間隔で実行できるプロンプトを設定できるようです。
ブログ投稿によると、Googleはプロンプト機能の開発を進めており、この機能のリリースに向けて準備を整えているようです。スケジュールされたプロンプトは以前から開発中であることが確認されていましたが、最近、機能フラグの下に隠されたままですが、ついに機能するようになりました。こちらがその様子です。ChatGPTのプロンプトと非常によく似ており、毎日、毎週、毎月など、いつ実行するかを設定できます。
興味深いことに、GeminiとGoogle全般が12月に多くの新機能と製品をリリースしています。これも今後数週間でリリースされる可能性のある機能の1つかもしれません。賢明な人が言ったように、私はとてもワクワクしています。
もう1つ興味深いことに、昨日のSam Altmanのバーチャルインタビューのライブストリームで、エージェントに関する彼らの会話と、エージェントがどのようなものになるのか、最終的にはどのような形を取るのかについて、いくつかの興味深い点が目に付きました。サムが言及した重要なポイントをいくつか聞いてみましょう。
まず最初に、エージェントについて多くの人が見落としていることについて質問されました。「エージェントの定義についてかなりの意味論的な混乱があるようですが、今日のエージェントの定義をどのように考えていますか?エージェントとは何で、何ではないのでしょうか?」
「これは私の即興の答えで、十分に考えられたものではありませんが、長期的なタスクを与え、実行中の監督を最小限に抑えることができるものです。エージェントについて人々が間違って考えていることは何だと思いますか?」
「むしろ、私たちのどの一人もまだこれがどのようなものになるかという直感を持っていないと思います。私たちは皆、重要そうに見えるものを指し示しているだけです。以下の例を挙げることができます。人々がAIエージェントが自分の代わりに行動すると話すとき、彼らが非常に一貫して挙げる主な例は、エージェントにレストランの予約をさせることができるというものです。Open Tableを使用するか、レストランに電話をかけるなどして。そうですね、それは少し面倒な作業で、いくらかの手間を省くことができます。
私が興味深いと思うのは、人間としてはできないことや、やりたくないことができる世界です。例えば、1つのレストランに電話をかけて予約するのではなく、私のエージェントが300のレストランに電話をかけ、私にとって最高の料理や特別なものが利用可能なところを見つけるとしたらどうでしょうか。エージェントが300のレストランに電話をかけるのはとても面倒だと思うかもしれませんが、もしそれらの300の場所それぞれにエージェントが応答しているのであれば、問題ありません。これは大規模な並列処理が可能で、人間にはできないことです。
これは些細な例ですが、人間の帯域幅には限界があり、これらのエージェントにはその限界がないかもしれません。しかし、私が思うより興味深いカテゴリーは、人々が普通に話すような、レストランに電話をかけるものではなく、非常に賢い上級の同僚のようなものです。プロジェクトで協力することができ、エージェントは2日や2週間のタスクを非常にうまく実行し、質問があるときはあなたに尋ね、素晴らしい成果物を持って戻ってくることができます。」
そして、SaaSについて話題が移ります。ソフトウェア・アズ・ア・サービスは、エージェントに関してどのように変化するのでしょうか。数日前、OpenAIのCFOが、これらのエージェントが提供する価値を反映した価格設定があるかもしれないと言及しました。特に、人間の労働力を置き換えることを考えると、月額X
ドルを人間に支払っていて、これが潜在的に人材を必要としなくなる場合、従業員の置き換えコストと呼ばれるものがなくなります。そのための公平な価格設定はどうすべきでしょうか?以前のように1席あたりで課金するのか、エージェントごとに課金するのか、これは重要な質問です。
これらのサービスの料金設定、コストは、労働者の置き換えがどれだけ早く進むかに大きく影響するからです。AIで労働者を置き換えて経費を90%削減できるなら、企業はこの技術を急速に採用するでしょう。コストの削減が10-20%なら、まだ起こりますが、それほど急速ではありません。もちろん、ゆっくりと進むほど、人々が適応する時間、政府が解決策やセーフティネットを検討する時間が増えます。
「これは根本的にSaaSの価格設定方法を変えるのでしょうか?価値の抽出について率直に考えると、通常は1席あたりの課金ですが、今は実質的に労働力を置き換えているわけです。企業の労働力の重要な部分となる場合、価格設定の将来をどのように考えていますか?人々のために何をするのか、どのように価格設定されるのでしょうか?」
「ええと...常に1席あたりの価格設定を維持するでしょうか?ここで推測してみましょう。でも実際にはわかりません。」
「サム、私はベンチャー投資家なので、推測して楽しむのは日常的です。」
「1GPUか10GPUか100GPUを常に問題解決に使用したいと言えるような世界を想像できます。1席あたりやエージェントあたりの支払いではなく、問題解決に取り組む計算能力の量に基づいて価格設定されるのかもしれません。」
「エージェント使用のための特定のモデルを構築する必要があるのでしょうか?それともその必要はないのでしょうか?」
「確かに、インフラやスキャフォールディングを大量に構築する必要がありますが、GPT-4o1は優れたエージェントタスクを実行できるモデルの方向性を示していると思います。ちなみに、"agentic"という言葉は嫌いです。新しい言葉を考えられたらいいのですが...」
「今がチャンスですよ、新しい言葉を。」
「まだ思いついていません。話している間に考えていきましょう。」
最後に、エージェントについて、そしてSamがまだ話せない研究のブレークスルーについて少し触れています。これは将来何が起こるかを示唆しているかもしれません。
「AIにおいて、誰も注目していないが注目すべきことは何でしょうか?」
「人々は全てのことに注目していると思います。私が見たいのは、この問題を解決する方法は多々ありますが、あなたの人生全体を理解できるAIについてです。文字通り無限のコンテキストである必要はありませんが、あなたに関する全てを知り、全てのデータにアクセスできるようなAIエージェントを持つ方法です。」
「サム、この1ヶ月で最も驚いたことは何ですか?」
「ある研究結果ですが、まだ話せません。しかし、息をのむほど素晴らしいものです。」
何かが起こり、それは息をのむほど素晴らしく、まだ話せないということです。彼のエージェントに関する指摘は興味深いです。AIのレベルがあるように、アシスタントとしてのパーソナルAIエージェント、そして最終的には組織全体やシステム全体を運営できるものを考えることができます。
私たちが今から見始めるレベル1は、これらの定期的なタスクをスケジュール実行できるようになることです。AIがAIニュースを要約して毎日小さな断片を送ってくれたり、家の周りでやるべき家事の全てが記載された文書にアクセスして読み、その日にやるべきことを思い出させてくれたりします。
毎朝実行できるため、やるべきことがない日は「今日やることはありません。今週予定されていることはこちらです」と言い、エアフィルターの交換など、やるべきことがある場合は「今日はエアフィルターを交換する必要があります」と言い、実行したかどうかを確認し、実行していない場合はフォローアップすることもできます。
しかし、前進するにつれて、最終的にレベル5やそれに相当するものは、あなたの人生全体を理解し、あなたに関する全てを知り、全てのデータにアクセスできるようなAIエージェントです。今や私たちのほとんどのものはデジタル化されているか、デジタル化できます。
あなたについて全てを知っているこのものを想像してみてください。コーチになることも、リマインダーアプリ、カレンダーになることもでき、誕生日に誰かに電話するよう促したり、あなたについて知っていることに基づいてより良い方法をコーチングしたりできます。気分が落ち込んでいる時はセラピストのように、「3日間運動していないですね。落ち込む前に試してみてはどうですか」というようなアドバイスもできます。
あなたの独自のスキルと能力に完璧に合った仕事をインターネットでスキャンし、場合によってはあなたの代わりに面接を受けることもできます。Samが話していた状況では、300のレストランに電話をかけ、それらすべてが他のAIエージェントによって応答される場合のように、仕事を探す場合も同様のエージェント的な方法で行うことができます。
最終的にはHRエージェントがあなたの小さなエージェントとコミュニケーションを取り、あなたの独自のスキルと能力をアピールし、会社が望むものすべてを得られ、あなたも望むものすべてを得られるようにすることができます。そして最終的には「この会社は素晴らしいフィットになりそうです。彼らは興味を持っています。実際に会いに行きましょう」と提案します。
これにより、何時間もの仕事が節約され、実際にはできないこと、つまり100の異なる企業にアプローチして、彼らがどのようなものか、どのように働くかなどの情報を得ることができます。あなたについて知っていること、あなたのデータへのアクセスを持っていることを活かして、あなたのために多くの考えと行動を行うことができます。
このJAWBONEとGoogleのバージョンであるTasksで、その方向への最初のステップを見ることになると思います。どう思いますか?これからの時代は刺激的です。19日頃、OpenAIの12日間のどこかでこのようなものが発表されるかもしれません。これについてとてもワクワクしています。
一見すると思われる以上に、多くの機能と使いやすさを持つことになると思います。なぜなら、彼らは検索機能を持ち、全てを書き出す代わりに単に前後にコミュニケーションを取ることができる高度な音声モードを持っており、このような自動化を作成できるものと組み合わせると、大きな可能性を秘めているように見えるからです。
とにかく、購読をお忘れなく、まだまだ多くのことが来ます。私の名前はWes Rothです。ご視聴ありがとうございました。very excite