マウスとキーボードがなくなる世界

2024年12月24日 17:03

Anthropicはどうした...？

OpenAIが12日間に渡り新たなモデルやサービス、機能を発表した。注目を浴びたもの、あまり印象に残らなかったものと双方あったが、概ね初日にユーザ解放されたo1 proと、最終日に発表されたo3の驚異的な性能が世間的には注目を浴びている。AGIの実現に際して重要なマイルストンになったと言えるだろう。

そして、過去には何かリリースするたびにOpenAIにその面目を潰されてきたGoogleは、今回はリベンジを果たしたようにも思える。Gemini2.0に始まり、Soraより優れていると専ら評判のVeo2から、無料で使えるreasoning model、量子コンピュータのWillowなど、総合的にはOpenAIより印象的な発表をしたという見方が強かったようだ。

この間、おとなしかったのがAnthropicだ。と言っても僅か数ヶ月前にComputer UseやMCPといった重要なリリースをしているのだが。OpenAIも競合するリリースを仕掛けてくるものだろうと筆者は予想していたが、期待を裏切られた形になった。LLMがPCを操作し、ローカルファイルからさまざまなアプリケーションまで操作してしまうのだが、この意義に衝撃を受けた人はどれだけいるだろうか...。

AI が変えるPC操作の常識

数年前には単なる夢物語と思われていた領域だが、Anthropicが発表した「Computer Use」は、その認識を一気に塗り替えた。これまでも「AIアシスタント」と称する仕組みは数多く存在してきたが、多くは単一アプリケーション内の文脈補完に留まっていた。たとえば、文書作成ソフトやメールソフト内での文章校正や返信提案などだ。しかし「Computer Use」が実現しようとしているのは、そうした単独アプリに閉じない、OSレベルや複数アプリ間をシームレスにまたぐ操作の自動化である。

たとえばExcelからデータを抽出し、社内のプロジェクト管理ツールに転記し、さらにSlackで報告…という一連の流れを、まるで人間がショートカットキーを使ってチャカチャカ操作するかのように実行可能にしてしまう。しかも、その命令体系は非常に直感的だ。自然言語で「昨日受け取ったCSVファイルをExcelで開き、行数をカウントして結果をチームのSlackチャンネルに共有して」と言うだけで、勝手に操作してくれる世界観だ。これこそ、多くのホワイトカラーが日々手動でやっている定型業務を一掃する可能性を秘めた技術ではないだろうか。

さらにAnthropicは「MCP（Model Context Protocol）」という仕組みも発表している。シンプルに言えば、Claudeのような大規模言語モデルをコアとしながら、ブラウザやローカルファイルの操作を直接命令できるプロトコルだ。たとえば「請求書のPDFをダウンロードしてフォルダを整理し、Googleスプレッドシートに必要項目を入力せよ」といった指示を、AIのアプリケーションに投げるだけで完結する。下手をすれば、人間がキーボードやマウスを操作する必要すらなくなる時代が、手元まで迫っているといっていい。

では、こうした技術の到来が何を意味するのか。現場の業務プロセスを一変させるのはもちろんのこと、とりわけ「派遣事務作業員」のようなホワイトカラーへのインパクトは甚大になりそうだ。定型化された事務タスクを行う派遣社員をオンデマンドで大量に雇うことが合理的だとされてきた企業のロジックが、急激に崩れ去るかもしれない。果たして、AIによるPC操作の急速な進化は、職場の景色をどのように変えていくのか。本稿では、その行く末を考察してみたい。

Anthropicが示唆する世界観

「Computer Use」が示唆する世界観において興味深いのは、その”命令”の自由度と抽象度の高さである。たとえば、「顧客管理システムにログインし、トップ顧客リストをExcel形式でエクスポート。そこから3ヶ月以内に新規契約をした顧客のみ抽出し、Slackにデータをアップロード」というような複合的かつ複雑な操作を、人間の思考フローに近い形で記述できる。これまでならばRPA（Robotic Process Automation）ツールで一連の処理をレコーディングし、ステップごとに条件分岐を設定し…という専門家の手間と時間が必要だった。しかし、Computer Useではこれを「自然言語だけ」で実行させる方向に舵を切っている。

ここで特筆すべきなのは、より深い「操作の自由度」にある。RPAは高い汎用性を謳いつつも、GUIの変更や予期しないポップアップが表示された瞬間にプロセスが止まってしまう弱点がある。いわば、アプリケーション間を跨いだマクロに過ぎない。これに対し、Anthropicのモデルは巨大な言語モデルが持つ文脈理解を活かし、予測不能な画面遷移や曖昧な命令にも柔軟に対応し得る可能性がある。もちろん、現時点では完璧ではない。しかし、こうした方向性が正しく育ったとき、「自分で判断して、臨機応変にクリックや入力を切り替えるAI秘書」が誕生するシナリオが見えてくる。

MCP（Model Context Protocol）により、この自由度はさらに加速する。PC内部のフォルダ構成やネットワークドライブ、さらにはブラウザで開いているタブを含め、モデルが参照・操作できるコンテキストが飛躍的に増大するのだ。まるで人間が「どのフォルダにファイルが入っていたっけ？」と探すように、AIがディレクトリを見に行き、適切なファイルを探し当てる。そこで求められるのは「命令の具体性」ではなく、「命令の意図を適切に伝える能力」だ。技術的にはこの命令の意図をどう安全に運用し、意図しないファイル消去や情報漏えいを防ぐかが大きな課題となるが、実現すれば人間のPC操作を限りなく“エージェント”に任せられる新時代の幕開けといえる。

筆者個人的にはOpenAIの安全性に懸念を持つメンバーが中心となって立ち上げたと言われるAnthropicだが、これらの技術の方が商業的でありかつ安全性の懸念はあるような気がしてならない。ただ、新たな可能性を示していることは間違いない。

ホワイトカラーへの影響：AIは業務を代行する？淘汰する？

こうした技術は、まず定型事務をメインとする派遣労働者や事務スタッフの役割を大きく揺るがす可能性が高い。過去を振り返れば、製造業の工場においても機械化が進み、簡単な作業や単純労働はロボットに置き換わってきた。しかしホワイトカラーの事務作業に関しては、「複数のチャネルを渡り歩く」「都度データを処理して誰かに共有する」といった操作が複雑すぎて完全自動化しにくいと長らく思われていた。これはまさに、a16zが主張する「Messy Inbox Problem」だ。多くの企業が「ややこしい手作業をまとめて処理してくれる事務作業員」を重宝し、時には派遣の形式でオンデマンドで調達してきたのも事実ではあるが、こうしたまだ人間にしかできなさそうだったややこしい事務作業はもはやAIの方が得意である可能性がある。

出所：The Messy Inbox Problem: Wedge Strategies in AI Apps

Anthropicの示すビジョンは、こうした複雑なPC操作をある程度まとめて“自然言語”だけで命令し、AIに任せてしまう世界だ。企業視点で言えば、人を雇って働いてもらうコストより、AIに月額サブスクリプション費用を払ったほうが結果的に安上がりで、かつミスが少ない（あるいはミスをしない）のであれば、そちらを選ばない理由はない。いや、もはや月額固定ではなく従量でも良いし、token利用料も毎年99%近く安くなっているという調査結果もあり、もはや実質無料でこうした作業は行われるようになっていくかもしれない。もちろん、AIなら24/365で働くし、雇用の心配もない。事務作業のコモディティ化が進み、「フロントで対人対応を担う社員」と「ITリテラシーを武器に高度な生産性を発揮する社員」だけを正社員として確保し、定型業務はAIが代行する──そんな構造へシフトしやすくなる。

さらには、派遣事務作業に留まらず、ミドルクラスのホワイトカラーにも影響が及ぶ。経営企画やマーケティング領域であっても、一定のルーチンワークは存在する。定期的に売上レポートを作成し、競合分析のためWeb上のデータを収集し、プレゼン資料をまとめる…こうした作業の一部、あるいは大部分がAIの支援によって大幅に効率化される。従来は部署間を行き来していた膨大なコミュニケーションも、「AIが自動で社内文書を解析し、必要事項をまとめて提案する」形で置き換わるかもしれない。「単純作業から解放される」というバラ色の未来を歓迎する声もある一方で、「作業のすべてをAIがこなしてしまうなら、自分は何をすればいいのか」という問いが突き付けられる。ここで生まれるのは、“業務代行”レベルの支援がやがて“人間に不要なポジション”へとつながるのではないかという根源的な不安だ。優れた経営リーダーたちは、複数のエージェントにいついつまでに（場合によっては「明日の朝までに」）これをやっておいて、と依頼し、それらを組み合わせて成果を創出していく未来もだんだん現実味を帯びて来た。まさに、Sam AltmanがDevDayで言及したように。

人々はエージェントに1ヶ月かかるような作業を依頼し、それが1時間で完了し、素晴らしい結果が得られ、そして同時に10の作業を依頼し、さらに1000の作業を同時に依頼するようになり、2030年かそこらになると振り返って「そう、これは人間が何年もかけて取り組んでいたこと、あるいは多くの人間が何年もかけて取り組んでいたことを、今はただコンピュータに頼めば1時間で完了する」と思うようになるでしょう。そして「なぜ1分ではないのか」と考えるようになるでしょう。

2024年10月1日 OpenAI DevDayでのSam Altmanの発言より引用

労働観を再構築する時

Anthropicが暗示しているのは、彼らが意図していようとなかろうと、単なるPC操作の効率化などという生易しい話ではない。大袈裟に言えば、GUIでPCを操作するという行為そのものが「過去の遺物」と化し、ビジネスパーソンがマウスやキーボードを使う機会が無くなる可能性を含んでいる。極端な例を挙げれば、社会人の「Excelスキル」が履歴書のウリになる時代は、遠からず終わるのは確実だ。むしろ「AIに誤操作させないためにどうプロンプトを設計するか」「AIが生成した情報をどこまで信頼し、どう検証するか」といった、新しい“情報リテラシー”や“指示統制力”が評価の軸になる可能性が高い。

どのようなポジションにいても、今まさに行うべきは「自分の仕事の中で、AIに置き換わりうる部分を理解しておくこと」と「人間にしかできない部分がどこにあるかを見極めること」。これは単なる自己防衛ではなく、組織におけるイノベーションを起こすための第一歩でもある。下手に足を引っ張り合うのではなく、AIを活用して業務全体の生産性を底上げし、新たな価値を創造する──そうした攻めの姿勢が、これからのホワイトカラーの生存戦略になっていくだろう。

今、オフィスでコンピュータを“手動”で操作しているすべての人が、数年後には「指示を出すだけの立場」になっているかもしれない。仕事そのものが変わるとき、人々の労働観やキャリア観も一気に変容する。もう「表計算ソフトをいかに素早く使うか」「如何に素早くプレゼンスライドを作るか」が評価の決め手になる時代ではない。今この瞬間にも、世界中でシステムがアップデートされ、働き方が塗り替えられている。残酷なほどに速いこの変化の波から逃れる術はない。もはやPC操作のスキルセットにしがみつくのではなく、新たなスキルを身につける勇気が求められている。ベテランマネージャーの仕事術を背中を見ながら何年もかけて学ぶような猶予は無い。今日から「AIに対する指示力」を磨くことが急務だ。派遣事務作業員であろうと正社員であろうと、常識とスキルの棚卸しが不可避な時代。それが今、目の前に迫っている。

余談

さて、本稿ではAnthropicの技術についてその世界観について述べてきたが、結局OpenAIはこうしたAgentについてまだ沈黙を貫いている。実はこうした製品を開発しているという噂はあるが、2024年1~2月頃の話であり、生成AI界隈のスピード感からすれば大昔のような話だ。12月の12Daysで何も発表が無かったのは、安全性の懸念があったのか…。いずれにせよ、2025年にここで述べた世界観がより現実のものとなることは間違いないだろう。

https://www.theinformation.com/articles/openai-shifts-ai-battleground-to-software-that-operates-devices-automates-tasks

Open AIは現在2種類のエージェントAIを構築中らしい
- 一つは、自由にデバイスを操作可能なエージェント
- もう一つは、Web上で様々な操作が可能なエージェント
OpenAIのVP of ProductであるPeter Welinder氏によれば、これらのエージェント製品は「すべてを変えるだろう」

This product will change everything. https://t.co/T85d529Myw
— Peter Welinder (@npew) January 26, 2024