見出し画像

2025年の生成AIにおける3つの最注目トレンドの概要と、企業や働き方への影響

2025年、生成AIはどのように進化し、私たちの働き方や社会にどのような影響を与えるのでしょうか?

本記事では、AI領域で注目すべき3つの動きに焦点を当て、2025年にAIがどのように発展するか、それによって企業や個人にどのような影響があるのかといった未来を考察していきます。

本記事は1/8に公開されたPIVOTでの登壇内容をnote化したものになります。サクッと理解したい方は本記事で、深く学びたい方は以下動画をご覧下さい。


2025年の生成AI、注目の3つの動き

まず2025年の生成AIで注目の動きとして、特に以下の3つが重要になってくると思います。

以下で1つずつ、①その概要、②2025年に起こり得る変化、③それによって企業や個人の働き方にどのような影響があるか、という観点で解説していきます。


1. AIエージェントの各領域での発展

そもそもAIエージェントとは

まずAIエージェントとは、「特定のタスクに特化した自律化型AI」のことです。

従来のAIアシスタントとは異なり、人間の指示に受け身で対応するのではなく、AI自身が与えられたゴールの実現に向けて、自律的に行動計画を立てて行動するのが特徴です。

AIエージェントと従来のAIアシスタントの違い

従来のAIアシスタントでは行為の中心があくまで人間だったのに対して、AIエージェントでは行為の中心はAIです。

行動スタイルとタスクの性質、外部ツールとの連携度合いも下図のように大きく異なります。

AIエージェントの具体例

AIエージェントの真価を最も体感しやすいサービスが「Replit Agent」です。

ユーザーが実現したいアプリケーションをテキストで入力するだけで、フロントエンドからバックエンドに至るまで、Webアプリケーションを生成してくれるAIエージェントになります。

例えば以下のように、簡単なテキストで指示しただけで、「登録/ログイン機能」、「キーワードから国立国会図書館のAPIを叩いて書籍のデータとサムネイルを取得」、「各アカウント毎に読書のレビューのステータスを保存」などの機能を持った読書管理サービスをAIに作らせることが可能です。

急増するAIエージェント

AIエージェントは単なる「新しいコンセプト」ではなく、すでに実際のサービスがリリースされている非常にアクティブな領域です。

以下はAIエージェントをまとめた一例ですが、各領域ごとに多くのAIエージェントがすでに市場投入されていることが分かります。

https://github.com/e2b-dev/awesome-ai-agents

さらには以下図のように、AIエージェント同士の分業体制もサービスによっては構築されつつあります。

https://arxiv.org/pdf/2404.11584

AIエージェントのインパクト

AIエージェントの進化によって、以下のような変化が起こると考えられます。

まず各領域に特化したAIエージェントが進化し、さらにはそうしたAIエージェント同士の分業も発展する中で、AIエージェントが対応できる業務が高度化していきます。そうすると行為の中心が人間ではなくAIなので、人間の介入が必要ない業務領域が今までの比じゃないレベルで発生します。企業はそうした余剰人員のリスキリングなどが重要なテーマになるはずです。

また、後述するReasoningモデルという高度な論理的思考力を備えたモデルとAIエージェントが組み合わさることで、戦略レイヤーの業務にもAIが入り込んでいきます。そうした時代においては、AIにしっかりと自社の情報をオリエンする、アクセスしやすくすることが重要です。(LayerXさんが「AIオンボーディング」という非常に分かりやすいワードで説明してくれています)

さらには、Replit Agentなどのコード生成AIエージェントが発展することで、長期的にはソフトウェアを取り巻くビジネス環境も根本から変わる可能性があります。SNSによってコンテンツの制作コストが著しく下がり、大手メディアからインフルエンサーなどの個人にパワーが移っていったのと同様に、AIによってサービス制作のコストが著しく下がる(ほぼ0になる)と、企業という大きな単位が運営するソフトウェアサービスから個人制作の大量の無料サービスにパワーが移っていく、ということが言えそうです。


2. Reasoningモデルの進化とAGI実現のカウントダウン

Reasoningモデルとは

Reasoningモデルとは、一言で表すと「答える前に考えるAI」です。
回答を生成する前に、複数ステップにわたる思考を行うよう設計されており、従来のモデルよりも推論能力が大幅に強化されています。

「GPT-4o」などの通常のLLMが、ユーザーの質問に対して脊髄反射的に即答するのに対して、「o1」などのReasoningモデルは思考プロセスをまず考えて、熟考した上で回答を返す、という形で思考プロセスにも大きな違いがあります。

通常のLLMとの比較

従来のLLMとReasoningモデルの違いは、人間の2つの思考モードで捉えると理解しやすいです。

https://psych.doshisha.ac.jp/staff/nakayachi/paper/p054.htm

「システム1」「システム2」というのは、心理学や行動経済学の概念でダニエル・カーネマンが「ファスト&スロー」で紹介して有名になったものです。

システム1が感情的・直感的で迅速だが大まかな判断をするのに対して、システム2は論理的・分析的で時間がかかる代わりに精緻な判断ができる思考システムです。人間の進化的にはシステム1の思考の方がはるかに古く、システム2は比較的新しい思考システムだと言われています。

これを従来のLLMとReasoningモデルとの比較に当てはめると以下のようになります。

従来のLLMはいわゆる「システム1」的な直感型の高速処理が得意です。

一方、Reasoningモデルは「システム2」に近く、じっくり考えるので遅い反面、複雑なタスクにも対応できます。一問一答的な比較的単純なタスクだけでなく、複合的な課題を解決したり、意思決定プロセスを支援したりすることが期待できます。

こうしたReasoningモデルの飛躍が起こった背景には、「従来のScaling則の限界」があります。従来は学習時のモデルサイズやデータ量、計算資源を増やすことで精度を高めてきましたが、ここに推論段階への集中的な計算資源投入を加えることで、今までの限界を大きく突破しています。

Open AI「o3」の衝撃

OpenAIから登場した最新モデル「o3」はあまりにも性能が高く、従来のベンチマークではもはや差が分かりづらくなってきたので、AGI(汎用人口知能)の実現進捗を測定するためのベンチマーク「ARC-AGI」が用いられました。

これはパズル的なクイズなど人間には解きやすいが従来のAIは苦手なIQテストのようなもので、o1モデルが30%程度のスコアなのに対して、o3は87.5%のスコアを叩き出しました。また、人間の平均スコアが85%なので、平均的な人間の知性を、一つのテストではありますが汎用知性を測るテストでもすでに追い抜きました


Reasoningモデルのインパクト

Reasoningモデルの進化によって、以下のような変化が起こると考えられます。

まず、Reasoningモデルが経営の意思決定支援や高度なデータ分析に活用され始めるでしょう。今までのLLMがシステム1的な知性に過ぎず、システム2的な知性の活用がこれから本格化すると考えると、「ホワイトカラーへのAIのインパクトはここからが本番」だと言えます。

また、「o1 Pro」に相談や質問を投げるとたいていの問いについてはきちんとした回答を返してくれるため、高度な知識や論理的思考能力などの「答えを考える能力」の希少性が下がる、と言えます。むしろ人間の価値は「問いを生み出す力」に求められる傾向が強くなると思います。

さらに、「AGI」にかなり近しい知性が2025年中に実現してもおかしくないと個人的には思います。o3は相当なブレークスルーを達成したようですし、OpenAI社内では早くもo4の研究を始めているとも聞きます。かつて人間の聖域であった囲碁・将棋でAIが人間を上回ったような現象(「囲碁・将棋現象」)が、企画する/経営する/発明するなどのあらゆる知的生産活動で起こっていっても不思議ではありません。


3. マルチモーダルAIの実用化

マルチモーダルAIとは

マルチモーダルAIとは、「テキストだけでなく、音声、画像、動画など様々な入力モードを組み合わせて理解・生成するAI」のことです。

代表例としては、OpenAIの「Advanced Voice Mode + ビデオ通話」やGeminiの「Realtime Streaming機能」などが挙げられます。

マルチモーダルAIのインパクト

マルチモーダルAIの進化によって、以下のような変化が起こると考えられます。

まず、スライド作成ツールやデザインツール、コーディングエディタなどでAIが視覚や音声でユーザーの作業環境を認識しながら支援してくれるコラボレーションツールが続々登場するでしょう。そうしてAIとの共同作業は当たり前のものになり、AIとのコラボレーション能力がより一層重要スキルになります。

また、「見せて話して教える」ことができるので、AIならではの特別な指示をする必要がなくなっていくでしょう。人間の部下と同じような指示出しが可能になることで、より仕事にAIが入ってくるスピードは加速するはずです。

さらに、スマートグラスをはじめとするウェアラブルデバイスやIoTとの連携で、AIに音声などのコンテキスト情報が自動入力されるようになります。その結果、AIに指示をしなくても、勝手にタスクを完了してくれるようになるでしょう。例えば会議室にデバイスを一つ置いておけばミーティングで話された内容をもとに勝手に先回りして調査やレポーティングをしてくれるなどのイメージです。


3つの進化は相互に補完し合う

これら3つの進化は、それぞれが独立して進歩するのではなく、相互に補完しあいながら進化を加速させていきます。

AIエージェントはインターフェースの進化であり、Reasoningモデルはモデル自体の進化、マルチモーダルAIもモデルの進化ですが扱えるデータの幅が広がるインパクトが大きいので、「インターフェース」「モデル」「データ」という三位一体の進化だと捉えることができます

その結果、上図のように「システム2的思考を持ったAIエージェントの登場/進化」、「視覚・音声情報を加味したシステム2的推論処理が可能になる」、「視覚・音声情報を自動収集して自律的にタスクを処理するエージェントの登場」などの相互進化が期待できます。

まとめ&宣伝

2024年も相当進化したAI領域ですが、2025年もより一層進化の激しい一年になりそうです。

細かく追うべき進化は他にも無数にあるのですが、まずはベースとして本記事で紹介した3つの動きは注視しておくとAI領域の進化の本流を捉えられるかと思います。

より深くAIについて、その事業活用、業務活用について学びたいと思われた方は、忙しいビジネスパーソン向けに厳選された最新テクノロジートレンドと実践的なビジネス活用ノウハウを提供するメンバーシップを始めたのでぜひ覗いてみて下さい。1月の登録限定でお得な価格でずっと購読できます。



いいなと思ったら応援しよう!

梶谷健人 / 「生成AI時代を勝ち抜く事業・組織のつくり方」
AIやXRなどの先端テック、プロダクト戦略などについてのトレンド解説や考察をTwitterで日々発信しています。 👉 https://twitter.com/kajikent