OpenAI、AIがブラウザー作業をやってくれる新機能

2025年1月27日 23:00

　今日もネットで見た興味ある記事を紹介します。
　私が勤める会社でも「RPA」を利用（※）していますが、OpenAIがブラウザーを使って自動実行する機能を追加するようです。
　※ 内部統制（決済事務）に関係する処理には利用していません。

▼ OpenAI、AIがブラウザー作業をやってくれる新機能　月額3万円ユーザー向け

　OpenAIが1月23日、ブラウザーを使った作業を代行できるAIエージェント『Operator』を発表しました。米国のProプラン（有料）ユーザーのみを対象とした研究プレビュー版として提供を開始するようです。
　Operatorは、独自のブラウザーを使用し、タイピング、クリック、スクロールなどの操作が可能。フォーム入力、食料品の注文など、日常的な作業を代行する機能があるようです。

▼ マウスとキーボードを使ったほとんどのアクションに対応できる

　本機能ではGPT-4oの視覚機能と強化学習による推論を組み合わせることで、画面に表示されるボタンやメニューなどのUIを操作できるようトレーニングした新モデル「Computer-Using Agent（CUA）」を搭載。
　マウスとキーボードを使ったほとんどのアクションに対応できるため、専用のAPIが用意されていないウェブサービスの操作を自動化することも可能だそうです。

▼ 安全性やプライバシー保護

　安全性やプライバシー保護に関しては、ログイン、支払い情報入力、注文の決定といった場面で、一度ユーザーに制御を戻す仕組みを採用し、さらに銀行取引や求人への応募など、重大な決定を要する作業については対応を拒否するようトレーニングされているというのです。

　同社では近日中にCUAのAPIを公開するほか、時期は不明ながらProプラン以外の有料プランにも本機能を開放する方針。ChatGPTとの機能統合についても、大規模環境での安全性と使いやすさに自信がもてるようになった段階で、実現したいとしています。

▼ 個人の所見

どこまでセキュリティが確保されているのでしょうか。　
重大な決定を要する作業については、対応拒否は良いのですが、単に数量だけを入力するなら、別のExcelシート等を入力元としてコピペするような作業だけで、そんなに毎日のように注文等をすることがあるのでしょうか。
ログイン、支払い情報入力、注文決定等ができなければ、それ程、作業効率化の効果は、余り見込めないのではないでしょうか

fin