
人類労働の残り7年 - オートメーションクリフを理解する
知識労働の終わりまで7年。あなたの年齢に+7歳して想像してみよう。
9,980 文字
皆さんこんにちは。この動画について、私は本当にワクワクしています。しばらく前から計画していたのですが、研究を重ねる中で、特にDeepResearchを使って改良を重ねていたので、内容をどんどん追加していきました。
では早速本題に入りましょう。私はしばらくの間、オートメーションクリフという概念について話してきましたが、これは私が考え出したものではありません。そこで、私の個人的な経験と、研究結果、そしてオートメーションクリフに基づく予測をお話ししたいと思います。
基本的に、オートメーションクリフとはこういう考え方です。この図を覚えておいてください。階段状の進化と、より急激な崖のような転落を比較したものです。簡単に言うと、技術の段階的な改善に焦点を当てると、自動化のレベルと人間の関与のレベルの間で、この階段状の漸進的な改善が得られます。自動化以前は人間の関与が高く、自動化のレベルは低い。これはテスラのFSD(完全自動運転)のレベルに似ています。現在はレベル3で、理想的な完全自動運転であるレベル5は人間の関与が全く必要ありません。一方、レベル3は99%の場合は機能しますが、エッジケースには対応できず、人間の介入が必要です。FSDレベル3の正確な定義は知りませんが、イメージは掴めると思います。
現在、ほとんどの産業はこの階段状のアプローチを取っていますが、その理由についても後ほど説明します。しかし理想的な世界では、また場合によっては、このような崖のようなアプローチになります。サムネイルで見たように、まさに崖から転げ落ちるような感じです。
では、オートメーションクリフとは何でしょうか。基本的に、オートメーションクリフの原則は、プロセス全体を完全に自動化してから一気に実行すべきだというものです。重要な原則の1つは、タスクは人間か自動化システムのどちらかが完全にコントロールすべきで、中間地点はないということです。
以前自動化エンジニアだった私個人としては、これを推奨していました。その理由は、システムは稼働するまで何もせず、完全なテストを行ってから稼働させると、一度に全てが自動化されるからです。これが私の言うオートメーションクリフです。他にもたくさんの原則がありますが、それに到達するまでの問題もあります。
ドロップイン技術について説明しましょう。数スライド戻って、何が起こるのかお見せします。このような自動化の崖は、通常ドロップイン技術と呼ばれるものがある場合に発生します。ドロップイン技術とは、基本的に、人間が100%関与する従来のやり方があり、それが突然、人間の関与が全く必要ない新しい技術に置き換わることを意味します。
ドロップイン技術の例をいくつか挙げてみましょう。必ずしも自動化ではありませんが、全てを一変させる可能性のある技術です。まず、USBです。私が小さかった頃、同年代や上の世代、下の世代の人々は、シリアルやパラレル、様々な接続方式を使っていました。今では全てUSB(Universal Serial Bus)です。
クラウド統合も同様で、SaaS(Software as a Service)は、ソフトウェアを切り替えられる良い例です。チャットボットも良い例で、Claude、ChatGPT、Geminiにサインアップでき、ほとんどが互換性があります。
GPSも、一度導入されると普及し、現在では様々な用途に使用できます。Google マップやFitbitなど、様々な波及効果をもたらしました。建物やその他のインフラのスマートな改修も同様です。
ダイヤルアップモデムは最も良い例かもしれません。既存の電話回線を使用し、デジタル化することで、モデム同士が通信して情報を交換できるようになりました。これが多くの人にとって、インターネットの最初の体験でした。その後、ケーブルモデムでも同じことが行われ、デジタルケーブルの広帯域を利用しました。
ストリーミングメディアも例の1つです。NetflixやDisneyなど、サービスを切り替えることができます。これらは、十分なインフラが整えば新しい技術を導入でき、非常に素早く採用できるドロップイン技術の例です。個人消費者レベルでは、ほぼ一晩で採用できます。これらの技術の中には、大規模組織での採用に時間がかかるものもありますが、それは組織の慣性が大きいためです。
完全自動化が優れている例をいくつか挙げてみましょう。完全自動化、つまり自動化の崖を実現できれば、より望ましい結果が得られます。例えば、オートパイロットです。当初は高度と速度を維持するだけでしたが、現在の航空機は非常に高度化し、パイロットがオートパイロットをオンにしたまま眠ってしまうという話もあるほど、航空機を100%制御できます。
製薬生産も例の1つです。これらの数値は全てDeepResearchを使用して得られたものです。そういえば、それらのDeepResearch記事へのリンクを証拠として含めるべきかもしれません。コメントで意見を聞かせてください。
製薬業界での経験や相談、対話を通じて、製薬業界は最も自動化が進んでいる産業の1つだと言えます。特に実際の医薬品製造において顕著です。「ライトアウト製造」、つまり人間が立ち会ったり観察したりする必要のない製造について考えると、不良率が0.1%から0.001%に低下しました。つまり、人間の監督者を置くことはむしろマイナスで、人間を完全に排除する方が良かったのです。
別の例は自動収穫機です。John Deereの完全自律型コンバインは、畑を走って全てを収穫する大型の機械ですが、収穫ロスを15%から2.3%に削減しました。これは、オペレーターの疲労やミスを排除できたためです。人間は間違いを犯しますし、1日10時間もトラクターを運転していると退屈してきます。
全ての例を詳しく見る必要はありませんが、オートパイロット、製薬製造、収穫など、様々な分野で完全自動化が実現可能で、望ましい例があることがわかります。
では、なぜ自動化の崖が望ましいのでしょうか。段階的に実装することもできるのに、なぜでしょうか。第一の理由は、引き継ぎによるパフォーマンスの低下です。テスラを運転している人々の動画を見ると、注意が散漫になって介入が必要になる場面があります。
ただし、その反例として、DeepResearchのようなツールを使用して認知的注意を分散させる場合、「ちょっとこの研究トピックを調べてきて、5分後に戻ってきます」というように、実際には脳を休ませる機会になります。
ある興味深い話があります。2011年か2012年頃、とあるソフトウェア会社で働いていた時、仮想インフラとビルドサーバーを構築し、ビルドプロセスが24時間から2時間に短縮されました。彼らは冗談めかしに「デイブ、それらのサーバーを取り除いてくれないか」と言いました。「アフターアクションレポートを作成する時間が少なくなった。24時間かかるビルドプロセスに慣れていたから、1日中作業できていたのに」と。私は「そうはしない。あなたたちが高速化を望んだから、12倍速くしたんです。これで対応してください」と答えました。
信頼性の問題、ワークロードの問題、部分的な自動化の監視は認知負荷を増加させる可能性があります。特に、異なる自動化ステーションを監視する場合はそうです。情報が速いペースで来ると、より早く疲れてしまいます。そのため、可能であれば完全な自動化の崖を目指し、現在のやり方から新しいやり方へ、中間段階を経ずに移行することが望ましいのです。
もう1つの理由は、インフラを何度も再構築したくないということです。人間の介入や部分的な自動化に対応するインフラを構築し、その後完全自動化のためにまた構築し直すより、待って一気に完全自動化を実装する方が良い場合が多いのです。
実際には、完全自動化がオプションではない場合が多いのですが、これは今後、エージェントとロボットの台頭とともに変化していく話です。
まず、経済的な障壁があります。完全な一貫自動化は非常にコストがかかる可能性があります。コメントやTwitterなどで多くの方が指摘しているように、最初の90%は実際にとても簡単です。自動化の最後の1マイルが本当に難しく、そこに90〜99%の自動化の努力が費やされます。
ある方が「自動化の分野では、全てがエッジケースだと気付く」と言っていましたが、それは悪くない考え方です。90〜99%の作業は単純で定型的なものですが、全ての例外、全てのエッジケースに対して高レベルの適応が必要です。
これが技術的な複雑さであり、汎用的な人工知能、つまりコンピューターを使用するエージェントやロボットが人間よりも認知的に柔軟になるまでは、自動化が難しすぎるのです。これは今まで自動化の最大の障壁でしたが、生成AIの言語モデルと認知アーキテクチャの台頭により、もはや障壁ではなくなります。
リスク管理やリソースの制約など、これらの要因が全て影響しますが、実際には経済性と技術的複雑さが完全自動化への2つの最大の障壁です。しかし、ロボットがより普及し、より知的になり、コンピューターを使用するエージェントもより普及し、より堅牢で知的になるにつれて、これらの障壁は急速に消えていくでしょう。
障壁と採用率について言えば、技術の採用率は加速していることを指摘してきました。自動車が飽和点に達するまでには長い時間がかかりました。このグラフは少し古く、インターネットは既に10年以上経過していますが、要点は理解できると思います。テレビは一旦安価になると急速に普及し、電気も急速に普及しました。これらは完全な採用まで数十年から1世紀かかりましたが、携帯電話、PC、インターネットはすべてより急速に採用されています。現在では、採用曲線は10〜20年で測られます。
インターネットが一定レベルの普及を達成した今、インターネットを通じて提供できるものは、チャットボットなどの人工知能を含め、はるかに速く採用されます。ロボットはインフラ構築が必要で、ロボットの出荷も必要なため、物理的な層があることでより摩擦が生じますが、一方で人型ロボットは完璧なドロップイン技術です。
続ける前に、私のリンクツリーについて少し触れたいと思います。私のSubstack、Patreon、学習コミュニティがあります。学習コミュニティでは週に2〜3回のレッスンを更新しています。Patreonでは専用のDiscordがあります。また、SubstackやTwitterもやっています。最近、AI生成音楽を置いているSoundCloudもリンクツリーに追加しました。サイケデリックスペースロックが好きな方向けですが、私自身よく聴いています。GitHubやSpotifyなども利用しているので、チェックしてみてください。
では本題に戻りましょう。このスライドは、実際にどこで自動化を試みているのかについて説明しています。私はDeepResearchに、今日、生成AIとロボット工学で人々が自動化しようとしている問題を探してもらいました。
まず、コンタクトセンターです。今までに、コールセンターのスタッフが90%削減されたという話を聞いたことがあるでしょう。エッジケースのために一部の人間を再雇用する必要があったという話もありますが、同時に、完全または主にAIに切り替えたコールセンターの多くで、顧客満足度も上がっています。多くの場合、完全自動化すると顧客はより幸せになります。サービスの質が向上し、サービスや会社、製品への信頼が高まるからです。
しかし、コールセンターが人員の90%しか削減できず、エッジケースのために10%が必要な場合、それは完全な自動化ではありません。さらに、まだ完全に自動化できない他の種類のコールセンターもたくさんあります。これは「low-hanging fruit(手の届きやすい目標)」と呼ばれるものです。
もう1つの例は小売店のレジです。セルフレジを使ったことがある方なら、時々故障したり、人間が監視していても退屈して盗難が増えたりすることを知っているでしょう。そのため、セキュリティのためのコンピュータービジョンが必要になり、レジの完全自動化をより困難にする様々な問題が発生します。
倉庫のロボット工学も例の1つです。Amazonのロボットの動画を見たことがあるでしょう。もはや人間が歩き回れない倉庫もあります。同時に、何百もの商品取得ロボットが存在する場合、複雑な創発的な振る舞いが発生し、システムが停滞することがあります。物理的な詰まりではなく、交通が混雑するような状況です。これらは現在も解決されていない課題です。
コールセンター、小売店のレジ、倉庫を完全に自動化できないのであれば、多くの仕事はまだ安全だと思えるかもしれません。しかし、ロボットがより知的になるにつれて、人間の介入なしでできることが劇的に拡大することを忘れないでください。これはコンピューターを使用するエージェントにも当てはまります。
シグモイド曲線や階段関数のような飛躍が見られ、1年前には自動化できなかったものが今では全て自動化できるという新しい能力が生まれるでしょう。私は企業時代にそれを個人的に目の当たりにし、コンサルティングしたクライアントでもそれを見てきました。今日自動化できることの中には、多くの人々がまだ自動化できないと信じているものもあります。これが私がこれらの動画を作る理由の1つで、自動化できないと思っているものが実は自動化できるかもしれないということを伝えたいのです。
このチャンネルでは人型ロボットについて多く話してきましたが、これが究極のドロップインソリューションである理由について説明したいと思います。重要なポイントは、人型ロボットは人間の空間で、人間の道具や乗り物などを使用して操作できるということです。
人間のロボットにGPT-4やGPT-5、あるいはClaude-4など、どのようなモデルであれ搭載すれば、既に大多数の人間よりも賢くなります。Boston Dynamicsの動画を見れば、それらのロボットは人間よりもはるかに機敏で、立ち上がってバック転もできます。私にはバック転はできません。
つまり、彼らは人間よりも強く、賢く、速く、より器用になります。これは完璧なドロップインソリューションであり、基本的に人間が手や目、体を使って行うあらゆる仕事を、これらのロボットがすぐにできるようになることを意味します。その汎用的な形状と機能は、必要に応じてコンピューターの前に座ってキーボードとマウスを使用することさえできます。
ただし、そのためにはコンピューターを使用するエージェントを使えば、ロボット全体を取り除くことができます。これは完全な自動化ソリューションを表しており、これが私が言う自動化の崖です。超知的で超強力、超器用、超機敏なロボットの出荷が始まると、人間の仕事の90%は終わりです。
次はコンピューターを使用するエージェントです。これは、OperatorやRepetなどの様々なツールで見られるものです。APIに焦点を当てるべきだと言う人がまだいますが、APIは一つのコンピュータープログラムが別のコンピュータープログラムと直接通信できるようにするアプリケーションプログラミングインターフェースです。しかし、キーボード・ビデオ・マウス(KVM)は普遍的なAPIです。
人間の知識労働の大部分はKVMで行われています。KVMでできることは、オペレーターもKVMでできます。これは普遍的なUIであり、他のインフラは必要ありません。カスタムAPIやAPI発見は必要なく、KVMが普遍的なAPIなのです。
つまり、コンピューターを使用するロボットを持つ代わりに、そのエージェントを任意のコンピューターやサーバー(仮想サーバーも可能)にドロップすれば、数百、数千、数百万の従業員が各自のラップトップ画面を使用しているのと同等のことが、クラウドのどこかにある仮想サーバー上で実現できるのです。
これが私たちが向かっている方向であり、クラウドサービスの採用について言及したことに関連します。インターネットを介して行われるため、展開は非常に速いのです。
これが私の個人的なタイムラインです。これは楽観的な自動化の波のタイムラインで、7年という時間枠に基づいています。7年というのは、企業が仮想化(私の専門分野)やクラウドソフトウェア(Software as a Service、私の仕事に隣接する分野)を採用するのにかかった時間です。
コンピューターを使用するエージェントは基本的に仮想化とクラウドソフトウェアであり、それらの採用に7年かかったことを考えると、今年から商業的な完全採用までに約7年かかると考えられます。今年はエージェントの展開を開始する年だからです。
2025年が初期展開で、コンピューターを使用するエージェントの展開が始まり、デジタル知識労働と人型ロボットも今年から増加します。2026年と2027年に大規模採用が行われ、フォーチュン500企業がコンピューターを使用するエージェントと人型ロボットを大規模に使い始めます。
Tesla Optmusやその他のロボットを既に使用しているフォーチュン500企業もあります。BMWがテスラ以外で最初に導入した自動車メーカーだと思います。
これが早期の大規模採用で、2028年から2030年に完全統合が行われ、2031年から2032年にかけて後発組や最適化が行われます。2033年までには、オフィスはロボットとコンピューターを使用するエージェントでいっぱいになるでしょう。これが私の個人的な予測で、あらゆる産業で知識労働が終わるまでに7年かかると考えています。
このグラフを使って説明したいと思います。これは先ほど示した採用曲線と非常によく似た採用曲線です。これは技術が飽和状態になる時点を示す線形の採用曲線ですが、別の見方をすると、各種の企業がいつ採用するかを示しています。
2024年以前はイノベーターの時期でした。2022年、2023年から私のYouTubeチャンネルを見ていた人々、ChatGPTが登場する前や登場直後から認知アーキテクチャやエージェントを実験していた人々です。Baby AGIの時代を思い出してください。これが最初の2.5%、出血大サービスのイノベーターでした。
今年と2026年は早期採用者の時期です。これは商業的価値があると判断した最初の行動者たちがトリガーを引く時期です。2027年から2028年は早期多数派で、一般的な企業がこれらの技術を採用し始めます。
既にAIツールを使用している弁護士や法律事務所を知っていますが、彼らはまだ早期採用者です。その後、大多数の法律事務所や医師のオフィスなどが採用を始めます。
次に後期多数派がいます。これはより懐疑的な人々や、従来型の店舗です。例えば、Home Depotは採用が少し遅れるかもしれません。なぜなら、そのビジネスモデルは1世紀以上変わっていないからです。実際の人々に対してハードウェアや工具を販売するというモデルです。
一部のビジネスや産業は、より抵抗を示すでしょう。一方、鉱業や建設などの重工業は、早期多数派に入るかもしれません。人間の労働は非常にコストがかかり、人命の損失や怪我も非常にコストがかかりますが、ロボットが岩盤の下敷きになっても税金の控除対象になるだけです。人命は控除対象になりません。
2030年以降は、世界の残りの部分が追いつく時期です。これが私の好ましいタイムラインです。
私はDeepResearchにこれら全てを考慮して独自のタイムラインを作成するよう依頼しました。するとより保守的なタイムラインを提示してきました。歴史的な証拠と、先ほど見た長期の採用曲線に基づくと、最初の波は2025年から2030年になるとしています。これは私の個人的なタイムラインではなく、AIがより保守的または現実的なタイムラインとして示したものだということを強調しておく必要があります。
2025年から2030年にかけて、デジタル知識労働の置き換えが見られます。早期多数派は2030年から2035年までないとしていますが、私はそうは思いません。
サービス統合、つまり早期多数派と後期多数派が見られ始め、より抵抗のある産業、例えば医療や教育などの非常に抵抗の強い産業では、完全な自動化は今後10〜15年はないと予想しています。繰り返しますが、これは時代遅れになるでしょう。
その後、州政府や連邦政府に対する規制圧力が十分になり、15〜20年後には物事を変える必要があると判断されるでしょう。2045年はシンギュラリティですから、シンギュラリティが到来した時に教員組合が依然としてAIを教室から締め出しているなら、大きな目覚めが待っているでしょう。
私が言ったように、このタイムラインは私にとっては保守的すぎますが、議論のために、これがAIが考えるタイムラインだということを示す必要がありました。
私が予測するのは、コンピューターを使用するエージェントとロボットが知能と普及の面で増加するにつれて、現在私たちが理解している形での労働力の完全な自動化が見られるということです。ポスト労働経済について議論することはできます。インフルエンサーのような一部の仕事は残ることを願っています。エンターテイナーも残るでしょう。全く新しい種類の仕事が生まれる可能性もあります。しかし、経済活動の大部分は近い将来、人間によって行われることはないでしょう。
完璧に安定した手、あるいは複数の手を持つ医療精密スーパーヒューマン手術ロボットと、最高の医療処置を常に研究しているコンピューターを使用するエージェントを組み合わせることを考えてください。このような世界では、人間の医師は必要なく、望まれもしないでしょう。
建設業界では、多くの人が「私はボイラーメーカーだ」「私は溶接工だ」と言って、自分の仕事は安全だと考えています。しかし、そうではありません。産業用ロボットは既に人間よりも精密な溶接ができます。工場のライン溶接と人間の溶接工の唯一の違いは、人間がより移動可能な形態を持っているということだけです。それは長期的には利点ではありません。
電気工、配管工、建設作業員、溶接工の皆さん、警告しておきます。私は前もって警告を発しているのです。それらの仕事はおそらくなくなるでしょう。
次は緊急対応です。救急医療技術者、消防士、警察官など、あらゆる種類の緊急対応者が含まれます。人間を排除し、煙、熱、生物学的、放射線的、化学的な攻撃に免疫のある機械を使用します。
「Surrogates」という映画がありました。興行収入はそれほど大きくありませんでしたが、ブルース・ウィリスの出演する素晴らしい映画です。その中の1シーンで、たくさんの兵士たちがVRをプレイする子供たちのように、戦場で小さな人型ロボットを操縦していました。ロボットが核攻撃を受けても、操縦者は「ちぇっ」と言って別のロボットに乗り換え、彼らにとってはただのゲームなのです。
科学と工学については、私の視聴者の皆さんには説明する必要はないでしょう。AlphaFoldなどの最先端に注目していますから。現在、世界中に800万から2500万人の科学者、博士号や博士課程の人々がいますが、間もなく数十億または数兆の同等の存在を持つことになります。
したがって、科学研究の大部分は自動化されるでしょう。それらのコンピューターを使用するエージェント、デジタルエージェント、あるいは狭いAIをロボットと組み合わせれば、望まない限り人間は必要ありません。もちろん、「ねえロボットさん、VXガスの製造は止めてください。私たちにとって本当に危険だから」というように、人間がまだ指示を出すことは望ましいでしょうが、要点は理解できると思います。
最後に、政府についてです。特にAIが国民のために、国民によって提供され、AIが直接国民に説明責任を負うのであれば、選出された政治家はどのような役割を果たすのでしょうか。私にはわかりません。
ご視聴ありがとうございました。多くのことを学んでいただけたと思います。ではまた。