AI Agentを6段階で考える

2025年1月5日 14:05

はじめに

生成AIを使ったソフトウェア開発が一気に加速しています。たとえば米オープンAIが2024年に発表した最新モデル「o3（オースリー）」は、世界有数のプログラミング大会で上位0.05%相当の成績を示し、まるでトップクラスのエンジニアのようにコーディングをこなせると話題です。国内でも、三菱総合研究所の調査によれば「プログラミング」に生成AIを活用している企業は3割を超え、今後はエンジニアがアーキテクチャ設計や運用体制の構築により集中できるようになると期待されています。

こちらの記事でのファインディ社長の山田さん、CTO佐藤さんのインタビューも読み応えあって面白いです。

こうした生成AIの進化をさらに推し進めた概念が「AIエージェント（AI Agent）」です。これは、ロボットやチャットボットといった単機能にとどまらず、人間のように環境を認識し、意思決定を行い、実際に行動する仕組みを指します。自動車の自動運転になぞらえて、AI Agentにもレベル0～5までの段階があるというのが今回ご紹介する論文「Levels of AI Agents: from Rules to Large Language Models」の主張です。以下、その内容をわかりやすく解説していきます。

AI Agentにもレベル分けの考えがある

自動車の自動運転は、運転支援のないレベル0から、最終的には完全自動運転のレベル5まで段階的に進化します。同じようにAI Agentも、どの程度の「知能」や「汎用性」を持つのかによってレベルを分類できるというのが、この論文の中心アイデアです。

この考え方はビジネスパーソンにとっても有用です。たとえばAIの導入を検討する際、「どのレベルのAIが必要か」をイメージできれば、投資額や開発期間、チーム編成のヒントになるからです。AIスタートアップ側から見ても、自社の技術やサービスがどのレベルに該当するかが明確になれば、事業戦略やアピールポイントを整理しやすくなります。エンジニアにとっては、具体的にどこを目指せばいいのか、技術上のギャップは何かを把握する助けになるかと思います。

L0～L5の6段階で見るAI Agentの進化

論文で提案されているレベル分けを簡単に説明します。

L0 (No AI)：AIによる学習・推論なし。単なるツール＋行動のみ

入力を受け取り何らかの動作をするが、自分で判断や学習を行わない
例）Excelマクロや単純な自動化スクリプト、センサーが感知した情報をそのまま通知するだけなど

L1 (Rule-based AI)：あらかじめ設定したルール（if-then）に基づいて動くAI

状況に応じてルールを変更すればある程度対応可能だが、大きく外れたケースや未定義のルールには弱い
例）固定のFAQリストによるチャットボット

L2 (IL/RL-based AI)：模倣学習(IL)や強化学習(RL)などを活用し、試行錯誤を通じて推論・意思決定をするAI

大規模データやシミュレーション環境を用いれば、複雑なタスクをこなせるが、学習コストや開発期間が長くなる傾向
例）AlphaGoのように勝敗を報酬として学習を重ねるゲームAI、ロボットアームが報酬を得ながら動作を学ぶシステム
※ここでの報酬は強化学習の用語です。

L3 (LLM-based AI)：大規模言語モデル（LLM）を中核に据え、言語理解や高度な推論が可能

大量のテキストから得た知識を活用するため、専門ツールや外部APIと連携するとさらにパワフルに。メモリや「振り返り」機能を追加し、やり取りの履歴を生かすことで、より人間らしい対話や行動が可能になる
例）ChatGPTのように汎用的な知識を持ち、文脈を理解して応答したり、文章生成ができる対話型AI

L4：L3を踏まえたうえで自律学習と汎化能力を付与し、新しい状況に柔軟に適応するAI

企業の業務環境が変化してもAI側が自主的に学習し続ける理想像。導入ハードルは高いが、大きな競争優位をもたらす可能性がある
•例）未知のタスクに遭遇しても、独自にツールを作ったり、継続的に学習を重ねて最適な行動を更新していく

L5：L4をさらに拡張し、感情や性格（パーソナリティ）を持ち、複数エージェント同士で協調・連携できるAI

社会的影響や倫理面の考慮が不可欠。いまだ研究段階の要素が多く、将来的な構想として語られることが多い
例）複数のAIが同時にコミュニケーションを取り、大規模なプロジェクトを分担して進める。人格や感情表現を伴い、人間と自然に関わるAI

レベル分けを踏まえて各視点で考えてみる

レベル分けの考えを踏まえた上でそれぞれの視点で考えてみましょう。

企業導入視点

• L2まで
ルールベース（L1）や強化学習（L2）を活用し、サプライチェーンや広告配信など特定分野を最適化。導入ハードルは低く、すでに多くの企業が活用中です。
• L3（LLM中心）
ChatGPTのような大規模言語モデルを使い、問い合わせ対応や文書作成を高度に自動化。短期間で効果が見込めるため、2024年は注目が高まっていました。
• L4以上
継続学習や自動最適化が可能な高レベルAI。研究・PoC段階ですが、ビジネスプロセス全体を自動化できる可能性があり、大きな競争優位をもたらすかと思います。

AIスタートアップ視点

• プロダクト開発
自社技術がL2かL3かなど、どの段階に強みがあるかを明確にする。
• 差別化戦略
例えばLLMをカスタマイズした独自の記憶機能やドメイン知識を実装すると、他社との差別化が図れます。
• 将来展望
L4やL5まで踏まえたロードマップを作ると、大きな市場変化にも柔軟に対応できます。

AIエンジニア視点

• 技術選定
強化学習、LLMなど、目的に合った技術領域を見極めることが大切。
• データ運用
レベルが上がるほど、扱うデータ量や多様性が増え、セキュリティリスクも大きくなります。
• スケーリング
本番運用でリソースが急増する場合があるため、インフラ設計を計画的に。
BLUEISHもスケールを意識したインフラ設計にかなり力を入れています。

今後の方向性

• 社会的インパクト
L5クラスでは倫理や法制度の整備が欠かせません。
• イノベーションの連鎖
L3やL4が普及すると新しいサービスやビジネスモデルが誕生し、競争環境が大きく変わる可能性があります。

企業の現場ではL2～L3が導入しやすい一方、L4以上の自律学習型AIが実現すれば大きな飛躍が期待できます。どのレベルを目指すのか、技術やリソースを踏まえた戦略設計が鍵になるのではないかと考えています。

まとめ

「AI Agentにも自動運転のようにレベルがある」という視点は、これからAI導入を検討するビジネスパーソンやスタートアップ、そして開発に携わるエンジニアにとって非常に示唆的です。L0～L5まで段階的に整理することで、自社が今どのレベルにあり、将来どこまで進化させたいのかをクリアにイメージできるようになります。

現時点では特にL3（LLMベース）が熱い領域と言えますが、これを足がかりにL4、さらにはL5へ進化していく際のインパクトは計り知れません。ビジネスや社会に与える影響も大きくなる分、法制度や倫理の観点も求められます。今後さらに研究・開発が進むことで、私たちの働き方や生活そのものが大きく変わる可能性があると私は考えています。

2025年は「AI Agent元年」と呼ばれていますが、その先にはどんな未来が待っているのか。本論文（Levels of AI Agents: from Rules to Large Language Models）を一読し、ぜひ次の一手を一緒に考えていきましょう！