![見出し画像](https://assets.st-note.com/production/uploads/images/171827353/rectangle_large_type_2_246563ccd79983de23b7684eb00fd3fa.png?width=1200)
【国内最速級】ChatGPT Operatorを実際に使ってみた【機能解説】
はじめに
最近、話題になっているChatGPT Operator。
https://openai.com/index/introducing-operator/
現在、公式には米国のproユーザーしか使えないことになっているのですが、機会があって社内で実際に使うことができたので、今回はその機能を解説してみようと思います。
![](https://assets.st-note.com/img/1737944870-pTP5L6hC8YydoSiAbs3fMr0v.png?width=1200)
![](https://assets.st-note.com/img/1737944898-hmOI03DYlUnHV71MixKWapLc.png)
Operatorが来ると、ChatGPTはどう見えるか
Operatorが利用できるようになったChatGPTユーザーの場合、ChatGPTの画面上、Soraの上に、Operatorの項目が出現します。
![](https://assets.st-note.com/img/1737945006-UMkslLXHnR97xmuB30hJrpfN.png)
これをクリックすると、Operatorの専用ページにアクセスできます。
裏を返せば、これが来ていれば、恐らくあなたはoperatorを使用することが可能になった、ということになります。
Operatorの画面と使い方
基本画面
![](https://assets.st-note.com/img/1737945151-QXyKLPc3du904BtkpGNC6liF.png?width=1200)
Operatorの画面には、個人で保存したタスク(後述)のほか、テンプレートとなっている各種タスクが例示されております。
![](https://assets.st-note.com/img/1737945204-cbSBjWefgF2LEA09hkq6H5Ur.png?width=1200)
サイドバー
Operatorの左側には、ChatGPTのように履歴と新規の項目があるほか、現在裏でActiveなタスクの情報も見ることができます。
![](https://assets.st-note.com/img/1737945413-eyjKtkXDWraxGPAER7J3YfT6.png)
![](https://assets.st-note.com/img/1737945511-41Z5dTFkt0yYcIlo2LbhSQWA.png)
実行中の画面
Operatorの実行中は、ミニブラウザが内側に立ち上がり、何をしているかがライブで映されます。
![](https://assets.st-note.com/img/1737945582-46CrMnlEkJ1YNDxKZehQiu2m.png?width=1200)
実行後の画面
タスクが終了すると、結果が説明されます。
ただ、ニュース解説系では、まだ説明不足気味のようです。
![](https://assets.st-note.com/img/1737945771-ObpSDadKhigHWXj4tm3GIBZP.png?width=1200)
実行後の画面には、通常のChatGPTにも存在するコピーとlike/dislikeのほかに、「view」というものが出てきます。
![](https://assets.st-note.com/img/1737945853-M0KLPwv4qX5m3uyxFlOYzGE8.png)
これをクリックすると、ブラウザが大画面に出てきます。
![](https://assets.st-note.com/img/1737945938-Vow9MhntAkuJsBNGUr3gKE0l.png?width=1200)
画面にホバーすると、「Take control」というボタンが表示されます。
![](https://assets.st-note.com/img/1737945983-lGqJhcaDPRQnLHM8mKdOA7uw.png?width=1200)
Operator browserを自分で制御する
これをクリックすると、一連の注意が表示されます。
![](https://assets.st-note.com/img/1737946012-XmigN9Z2sr8A3q4BHMxlOS0V.png)
![](https://assets.st-note.com/img/1737946027-C3S9WLFfarXRGstUeucANKB4.png)
![](https://assets.st-note.com/img/1737946043-dgR3uK1LU6itbSXvHQhImVlc.png)
整理したい場合は設定画面の「Manage data」でやってね、というメッセージ。
これらについて、「Next」「Done」をクリックすると、Operatorのブラウザを自分で制御できるようになります。
![](https://assets.st-note.com/img/1737946070-bazhk9O0vi65ZuPQ2n1FqGHt.png?width=1200)
ただし、動作は通常のブラウザより重いので、必要性がない場合はあまりお勧めしません。
制御は、「Finish up」をクリックするとやめることができますが、その際に、何か変更した場合は、何をしたかOperatorに教えることも可能です。
![](https://assets.st-note.com/img/1737946351-7uPcS6xqF3CIAnhmHtXVwJko.png)
Exit to chatを押すと、元の画面に戻り、Return control to Operatorを押すと、自動でOperatorが処理を再開します。
![](https://assets.st-note.com/img/1737946456-kJYo0sFuOmv8Gy1XpUEhefIW.png)
シェア画面
タスクが終了すると、シェアをすることができます。
ただし、通常のチャットと異なり、シェアは「動画」で行われます。
![](https://assets.st-note.com/img/1737946528-N7a2dFbQlfWzU0JMAEnmryj8.png)
「Create shareable video」でまずビデオを作成することができます。
押すと、作成画面が立ち上がります。
![](https://assets.st-note.com/img/1737946599-bPSCYmjaIfixoNFBuzOK3wGD.png?width=1200)
完成した動画を、この画面から公開することも可能ですし、元の画面の「View Video」「Publish」からも公開することができます。
![](https://assets.st-note.com/img/1737946684-fyjW3JCvXIGK7oNsk1Dnucq5.png)
動画が完成すると、どんなことをしたのか、動きを追えるようになります。
![](https://assets.st-note.com/img/1737946734-5bkRA8yrwO0NQVYl1x2gFGuD.png?width=1200)
実物を共有します。
国内でも、シェアされた動画の閲覧は可能なようです(手元検証結果)。
なお、後述するinstructionの検証ケースで分かったのですが、一度シェアしたビデオも、sync videoという項目によりアップデートできます。
タスクの保存
いい感じに動くタスクは、Shareボタンの隣の、「Save Task」から個人用として保存することができます。
これをクリックすると、タスクの概要が自動的に記入されます。
![](https://assets.st-note.com/img/1737947095-1HcKd0m2tvrJFNGxpSZijVbY.png?width=1200)
その内容に不備がある場合は、手入力で修正しても構いません。
いい感じであれば、Saveします。
Saveされたタスクは、設定画面に表示され、ここからの編集や削除も可能です。
![](https://assets.st-note.com/img/1737947216-nD9SNZd8Fg7fmoV5tOWTpIQh.png?width=1200)
![](https://assets.st-note.com/img/1737947285-XBKJ5gUVlLFDS0oHadwYTpjb.png?width=1200)
また、個人用タスクとして、Operatorのトップ画面に表示されるので、お手軽に呼び出せるようになります。
![](https://assets.st-note.com/img/1737947312-R8zigxutbNm6J3X1O5LrTHVc.png?width=1200)
Operatorの設定画面
Operatorの設定画面は、通常のChatGPTと同様、サイドバー左下のアカウントをクリックすることで開けます。
General
こちらから開いた場合、最初に立ち上がるのはGeneralタブです。
ここには、基本的な情報が記載されます。
![](https://assets.st-note.com/img/1737947600-vMgbCEKmFTo0arSO9VekwfPn.png?width=1200)
ここでは、テーマ、ブラウザ通知有無、メール(確認のみ)、アカウント設定(ChatGPT側へ移動するだけ)、ログアウトのほか、専用のCustom Instructionsが設定できるようです。
このCustom Instructionsは、Operator全体で利用可能、とのことです。
Saved tasks
こちらでは、先述のような、タスクの管理・編集・削除ができます。
![](https://assets.st-note.com/img/1737947216-nD9SNZd8Fg7fmoV5tOWTpIQh.png?width=1200)
加えて、この画面で完全新規に個人タスクを作成することも可能です。
実際に開いてみると、以下のような画面が表示されます。
![](https://assets.st-note.com/img/1737947888-tR68ge4ailjcvMs0bUQPYBzq.png?width=1200)
既遂タスクのセーブ時と異なり、自分の手ですべて入力する必要がある点は注意が必要です。
Websites
Websitesタブでは、現時点で公式の対応が行われているサイトがリストアップされています。
![](https://assets.st-note.com/img/1737948034-EWntMLaidpvGu5PYxOA7Qy4Z.png?width=1200)
クリックすると、個人用設定が追加できるようです。
![](https://assets.st-note.com/img/1737948081-HTZkEgn7prtl0Qsm2KIfyvFU.png?width=1200)
ここでは、追加指示(Additional instructions)をセットしたり、ログイン済みなどの場合にログアウトとキャッシュ消去を実行したり、個人的なカスタマイズそのものの削除を行ったりすることもできます。
Additional instructionsは、Editをクリックすると、その場で編集・保存ができます。
![](https://assets.st-note.com/img/1737948219-3LcCl8SBAJdxKXiHE90usqwg.png?width=1200)
Privacy
最後は、Privacyタブです。
![](https://assets.st-note.com/img/1737948291-5KnAOvDF3ZxXsUES7hWQtIL1.png?width=1200)
ChatGPTと共通の学習設定や、ブラウジングデータ・チャット履歴の管理ができます。
Browsing dataだけ、開くと、このような画面になっています。
![](https://assets.st-note.com/img/1737948425-kmjOE5QVq1TgXbAuJDhwSC9U.png?width=1200)
全体削除のほか、サイト別データの管理もできます。
Site Dataを開くと、以下のような画面になります。
![](https://assets.st-note.com/img/1737948468-2Mal1FrWLA4p7wDKyzsQ0RJI.png?width=1200)
設定画面は、以上となります。
Operatorにおけるinstruction系の威力を調べてみる
さて、せっかくいろいろinstructionが設定できると分かったので、実験してみましょう。
Custom Instructionsをツンデレにして、先ほどAdditional Instructionsを入れたMeme generatorで、どんなミームができるかテストしてみます。
![](https://assets.st-note.com/img/1737948680-Un6ag0c2dTpMRGqkmhbvi8eP.png)
せっかくなので、空っぽの個人用タスクから新規作成して、それでやってみましょう。
![](https://assets.st-note.com/img/1737948981-SkvwNTm1CZP3yDFh8QOrsjVo.png?width=1200)
これを実行してみます。
![](https://assets.st-note.com/img/1737949477-xUB6vG9nRClWsri3Ih7TwLQ0.png?width=1200)
応答は日本語で、確かに日本文化を意識していますが…ツンデレ口調はどこかに消えてしまいました。
ただ、そもそも口調指示系Custom instructionsは、よほど強く言わないと聞かないので、ここは将来的にまだプロンプトエンジニアリング層が入って、いろいろといじる余地が残る領域かもしれません。
…と思ったら、二発目で発動しました。
![](https://assets.st-note.com/img/1737949646-d4xORfJvDYA9Nq5ESQ2rByoi.png)
せっかくなので、出来上がったミームと、作成過程もシェアしておきます。
![](https://assets.st-note.com/img/1737949736-oSy87dspf1LZDmxMKai3Hghu.png?width=1200)
まとめ
ここまで、ChatGPT Operatorの各種機能と使い方を説明してきました。
基本的な使い方を押さえて、実際に使ってみたところ、Browser Useに比べても、対応済みサイトでは比較的素直に動いてはくれるようでした。
ただ、ニュース系のまとめはまだデフォルトの指示では短くなりすぎたり、公式のリストにないサイトのテストなどではまだまだうまく行かないという報告もあり、そうしたところが、現在research previewである理由なのだとも感じました。
大きな方向性としては、以前書いたように、AIエージェントがウェブを操作する時代が現実的になりつつあると思います。
ただ、API処理に比べると、原則として遅いことにも注意が必要です。
共有動画では短縮されていますが、実際には、10秒かそこらで済む処理に数分かかっているのが、今のAIエージェントによるブラウザ操作です。
そのことを踏まえたうえで、これまでAI界隈では、技術的な障壁でしかないものはやがて解消されてきました。
例えば、AI生成画像の指がおかしくなったり、パスタを食べる動画で手づかみしてしまったりする初期のAIの個別の課題は、それぞれ数か月スパンで着実に改善されてきました。
同様に、恐らく年内には、人間並みに高速なブラウザエージェントが誕生しても、おかしくはないと思います。
そうなった時に、どこまでAIを制御して、どんな操作をさせるか?
そのことは、今から考え始めておいた方がいいでしょう。
そうした意味でも、Operatorの日本への本格上陸が楽しみですね。
おまけ:Xの投稿は行けた(ログインアラートは出る)
ちなみに噂通り、Xの投稿はいけました。
Hello from ChatGPT Operator!
— MyTH株式会社 (@MyTH_ai_one) January 27, 2025
【国内最速級】ChatGPT Operatorを実際に使ってみた【機能解説】|MyTH株式会社 @MyTH_ai_one #note https://t.co/eL3raXKuQq
ただ、あまりに異なる環境からのログインとなり、ログインアラートなどが出てくるので、あまりオススメはしません。