2025年はAIエージェントのビジネス実装が本格化するんだろうな

2024年度の頭に書いた今後の見通しはそんなに外れてなかったですが、そのうちAIエージェントについては、2024年は研究から応用への展開を模索する段階、そして2025年から個別サービスへの具現化と提供の段階になっていく感触です。
AIエージェントは急に出てきた話題ではなく、LLMが話題になった2023年半ばにはBabyAGIやAutoGPT、code interpreterやopen interpreterのようなものが出ていてAIに駆逐されるコンサルタントもいそう…などと危機感を持ったものです。そこからより特定の目的やユースケースに特化して、製品としてもより具体化・洗練していくことで、ユーザからイメージしやすい・使いやすいようになったのかな、と推察しています。

もう少し背景的なところから触れると

以前から取り上げるように、遠からず学習データが枯渇するので、今の学習スキームによるAIモデルは単純な精度向上は徐々に望めなくなっていきます。加えて、プロンプトエンジニアリングやRAG(Retrieval-Augmented Generation:外部データから情報を取得してLLMに回答を生成させる技術)で作ったソリューションにカッコいいUIつければ解決する問題は比較的先を行く企業ではやり尽くされ始めていて、より込み入った問題へのアプローチが模索されている状況があります。

実際いくつかのAIソリューションは精度向上のために内部的に(マルチ)エージェントAIを使っていたりします。 

AIエージェント動向まとめ

具体的なコンセプトや用語を含めて、だいたいこの辺りを見れば十分に理解できるかなという記事

BabyAGIやAutoGPT、open interpreterのような汎用的なAIエージェントの頃は、面白いけど実務に落とすには設計が難しいし足りないことも出てくる感じでした。それが業務特化のエージェントが出てきて使われ始めた感じがします。

ソフトウェア開発に特化したDevin.aiの商用化

以前から取り上げていたDevin.aiが商用化され、日本でも先端企業が手を出し始めています。【Devinのできたこと・できなかったことシェアです🔍(2024/12/27時点, 2週間半使用してみた感想)】

もう1つのユースケースは「PC操作機能の自動化」

AIエージェントにブラウザ越しの作業をさせる「Browser Use」ってのが出てきていて、詳細はGitHub - browser-use/browser-use: Make websites accessible for AI agentsにありますが、ザクっと見るには以下の記事。

上記の大半の例はスクレイピングで、今までだとpythonライブラリがあるとはいえ何十行もコードを書いたり細かめの設定をしなくてはいけなかったのが、数行のpythonコードと自然文のプロンプトで書けるなら、確かに圧倒的に楽になると言える。他にどんな機能があるのかは要調査。

Browser UseじゃなくてもスクレインピングするAIエージェントとしてFirecrawlが出てきてます。

11月の記事で取り上げたAnthropicのClaudeが出した「computer use」「Model Context Protocol」で凄いと思ったけど、「PC操作機能の自動化」というユースケースの括りは注目度が高いっすね。

まぁAIエージェントとRAGを併用すれば良いよね、というのもごもっともな記事も。

ちなみにデータ分析向け業務でのpandas dataframe agentとかはLLMでできる範囲のデータサイエンスで取り上げている。

テック企業の動き

前半にも貼った2024年ビッグテックのAI Agent動向まとめという記事にもまとまっているけれど、上記の事例の対抗馬になりそうなものを一番わかりやすく出してるのはグーグルかと

OpenAIも活動しているのはLLMで進展するマルチエージェントの方で取り上げたけれど、具体的なソリューションというよりは、そのためのフレームワークを出したりする方の印象。あとビッグテックのAI Agent動向になかったのはsakana.ai、マルチエージェントAIなんだけど、なんかマルチエージェントAIの記事の方に入れるには何かが違う(のをまだ言語化できてない)のだけど、AIエージェントとしては気にしておくべき動き。

 AIエージェントの評価

についても議論が出始めている。

結局AIエージェントで何ができるか、何をさせたいかがカギ

Browser Useに限らずAIエージェントで他に何ができるか考えると、ユースケースを見つけるのが、やはりカギなのだろうな、と思う。とはいえ売れるユースケースが何かはわからないので、いろいろ手を出してみるしかないか。

そもそも特定の用途に特化させてLLMを使うなら、AIエージェントで実装しない方が、速度も、性能も上がると言われれば、その通り(笑)

いいなと思ったら応援しよう!