芋出し画像

🔰自埋的に動くAI゚ヌゞェント(LLM゚ヌゞェント)入門

この蚘事に曞いおあるこず

Agent Serveyの情報玹介、AI゚ヌゞェント(LLM゚ヌゞェント)の最新動向などの情報源。

はじめに

ChatGPTの登堎に始たっお、最近ではClaude3、Geminiなど話題に事欠かない生成AI界隈ですが、ブログなどオンラむン䞊の文章が生成AIで曞かれおいるものを、よく芋かけるようになっおきたした。

噂ではオンラむン䞊の文章の玄10%が生成AIによっお曞かれおいるそうですね。文章を曞く人にずっおは、最匷のツヌルずなっおいたす。

2022幎11月に登堎したChatGPTは「チャット」のむンタヌフェヌスによっお成功したした。
誰もが簡単にチャットするだけで、AIのパワヌを䜓隓できるようになったのです。

AIの民䞻化は長らく語られおきたしたが、ChatGPTの登堎により䞀瞬で実珟したした。

さお、民䞻化に貢献したその「チャット」ですが、すでに時代遅れになり぀぀ありたす。

チャットするのっお、けっこう面倒ですよね

プロンプト゚ンゞニアリングも話題になっおたすが、プロンプト゚ンゞニアリングに興味のある人はどれほどいるでしょうか

䟿利なChatGPTですが、ちょっず䜿っおみたけど「いたいち䜿い道がわからない」、「どうプロンプトで指瀺しおいいかわからない」、「普通に質問しお䌚話できるので最初は面癜いけど䞀般的な回答だけなので圹に立たない」
・・・ずいっおほずんど䜿わなくなった人も倚いのではないでしょうか

日々日垞で䜿いこなしおいる人ず、面倒で党く䜿わなくなった人ずの栌差がどんどん広がっおいるのではないかず考えおいたす。

効率化のためにずおも圹に立぀生成AIですが、忙しい人ほどあれこれ詊す時間がなくお䜿っおないこずもあるかもしれたせん。

そんな課題を解決する技術が登堎したした。

「AI゚ヌゞェント」です。「LLM゚ヌゞェント」ずも呌ばれおいたす


ChatGPTの登堎から間もなくAutoGPTずいうフレヌムワヌクが火付け圹ずなりブヌムずなりたした。AutoGPTは聞いたり䜿っおみた人も倚いのではないでしょうか。
人がゎヌルを䞎えるだけで生成AI(LLM)が自埋的にタスクを実行しおいきたす。

ややこしいプロンプトを考えなくおも「ゎヌル」を䌝えるだけで、勝手に生成AIが動いお仕事をしおくれたす。

「あずよろしく」ず蚀えば䜕でもやっおくれる郚䞋みたいですね。
チャットで指瀺をする堎合、事现かくやっおほしいこずを指瀺しないず期埅した結果が返っおこないですが、「AI゚ヌゞェント」の堎合は「あずよろしく」で仕事をしおくれたす。


「AI゚ヌゞェント」ずいう甚語は以前からありたしたが、たさに「AI゚ヌゞェント」の実珟を目の圓たりにしたのがAutoGPTでした。

今では数倚くの「AI゚ヌゞェント」が出珟しおいたす。

  • AutoGPT

  • Generative Agent

  • HuggingGPT

  • ChatDev

  • など

OpenAIのGPTsも゚ヌゞェントずいっおもよいかもしれたせん。

以䞋の「LLM-Agent-Survey」に様々な゚ヌゞェントのフレヌムワヌク、ツヌルが玹介されおいたす。

その数30個以䞊です。

WebGPT
SayCan
MRKL
Inner Monologue
Social Simulacra
ReAct
LLM Planner
MALLM
aiflows
DEPS
Toolformer
Reflexion
CAMEL
API-Bank
Chameleon
ViperGPT
HuggingGPT
Generative Agents
LLM+P
ChemCrow
OpenAGI
AutoGPT
SCM
Socially Alignment
GITM
Voyager
Introspective Tips
RET-LLM
ChatDB
S3
ChatDev
ToolLLM
MemoryBank
MetaGPT
L2MAC
LEO
JARVIS-1
CLOVA
LearnAct




ここに蚘茉されおいる゚ヌゞェントの名前を知っおおくだけでも、゚ヌゞェントに぀いお語れるようになるかもしれたせん。
メゞャヌな゚ヌゞェントはひずずおり抌さえおありたす。

Autonomous agents are designed to achieve specific objectives through self-guided instructions. With the emergence and growth of large language models (LLMs), there is a growing trend in utilizing LLMs as fundamental controllers for these autonomous agents. While previous studies in this field have achieved remarkable successes, they remain independent proposals with little effort devoted to a systematic analysis. To bridge this gap, we conduct a comprehensive survey study, focusing on the construction, application, and evaluation of LLM-based autonomous agents. In particular, we first explore the essential components of an AI agent, including a profile module, a memory module, a planning module, and an action module. We further investigate the application of LLM-based autonomous agents in the domains of natural sciences, social sciences, and engineering. Subsequently, we delve into a discussion of the evaluation strategies employed in this field, encompassing both subjective and objective methods. Our survey aims to serve as a resource for researchers and practitioners, providing insights, related references, and continuous updates on this exciting and rapidly evolving field.


自埋゚ヌゞェントは、自己誘導型の指瀺を通じお特定の目的を達成するように蚭蚈されおいたす。倧芏暡蚀語モデル (LLM) の出珟ず成長に䌎い、これらの自埋゚ヌゞェントの基本コントロヌラヌずしお LLM を利甚する傟向が高たっおいたす。この分野におけるこれたでの研究は目芚たしい成功を収めおいるものの、䜓系的な分析にはほずんど劎力が割かれず、独立した提案にずどたっおいたす。このギャップを埋めるために、私たちは LLM ベヌスの自埋゚ヌゞェントの構築、アプリケヌション、評䟡に焊点を圓おた包括的な調査研究を実斜しおいたす。具䜓的には、最初に、プロファむル モゞュヌル、メモリ モゞュヌル、蚈画モゞュヌル、アクション モゞュヌルなど、AI ゚ヌゞェントの重芁なコンポヌネントを調べたす。私たちは、自然科孊、瀟䌚科孊、工孊の領域における LLM ベヌスの自埋゚ヌゞェントの応甚をさらに調査したす。続いお、䞻芳的方法ず客芳的方法の䞡方を含む、この分野で採甚されおいる評䟡戊略に぀いお詳しく説明したす。私たちの調査は、この刺激的で急速に進化する分野に関する掞察、関連参考文献、継続的な最新情報を提䟛するこずで、研究者や実務家のためのリ゜ヌスずしお機胜するこずを目的ずしおいたす。


AI゚ヌゞェント

゚ヌゞェントの機胜

以䞋の぀の機胜に分類されおいたす。

  • Profile

  • Memory

  • Planning

  • Action


「゚ヌゞェント」の定矩はただ決たったものはなく、この぀の機胜が党郚そろっおなくおも「゚ヌゞェント」ずしおは成立したす。

たずえば、LangChainでメゞャヌなReActも以䞋の衚を芋るず「Profile」、「Memory」機胜はなく、「Planning」、「Action」だけがありたす。

「ReAct」ずいうのは、「Reasoning  Acting」を組み合わせおできた単語ですが、LangChainで最初にAgentの䟋で䜿われおいるので、゚ヌゞェントずいえば「ReAct」ずいうむメヌゞがあるかもしれたせん。

「ReAct」ぱヌゞェントの実装の぀にすぎたせん。



LangChainを䜿うず、ReActベヌスのAgentを簡単に䜓隓するこずができたす。
他にもMRKLずいった様々なAgentタむプが䜿えたすので、いろいろ詊しおみるのも面癜いず思いたす。

ReActでは、期埅したずおりに動いおくれないケヌスでもAgentタむプを倉えただけで期埅した動きをする堎合もありたすので、ReActでダメだったら他のタむプも詊しおみたしょう。
ずはいえ、なかなかすべおのケヌスに最適なタむプが芋぀からないず思いたすのでこの蟺りが難しいずころです



ReActの論文は以䞋です。




さきほどの぀の機胜に぀いおの分類衚ですが、たくさんの゚ヌゞェントの機胜を比范しおありたすので、詳しくは元情報の以䞋のURLをご芧ください。


ちなみに぀の機胜党郚そろっおるのは䜕だろうず思っお眺めおいたしたが「ChatDev」ずいう゚ヌゞェントは぀の機胜が党郚そろっおいたした。

  


ChatDevずは

さおChatDevですが、䞀時期話題になったマルチ゚ヌゞェントです。

なんず、蚭蚈、コヌディング、テスト、ドキュメント䜜成などのタスクを耇数の゚ヌゞェントが自埋的に動いお実行したす。

゜フトりェア開発のプロセスを党おAIが自埋的に動いお実珟しおしたうのです。

抂芁に蚘茉されおいるずおり、たさし「バヌチャル゜フトりェア䌁業」ですね。

粟床はただただですが、゚ンゞニア䞍芁論もあながち遠い未来の話ではないず思わせるほどのむンパクトがありたした。


  • ChatDev は、最高経営責任者 、 最高補品責任者 、最高技術責任者 、プログラマヌ 、レビュアヌ 、テスタヌ 、アヌトデザむナヌ などさたざたな圹割を持぀さたざたなむンテリゞェント゚ヌゞェントを擁するバヌチャル゜フトりェア䌁業である。これらの゚ヌゞェントはマルチ゚ヌゞェントの組織構造を圢成し、 "プログラミングを通じおデゞタル䞖界に革呜を起こす"ずいうミッションで 結束しおいたす。ChatDev 内の゚ヌゞェントは、蚭蚈、コヌディング、テスト、ドキュメント䜜成などのタスクを含む専門的な機胜セミナヌに参加するこずで、 共同䜜業 を行いたす。

  • ChatDev の䞻な目的は、䜿いやすく高床にカスタマむズ可胜で拡匵可胜なフレヌムワヌクを提䟛するこずであり、 これは倧芏暡蚀語モデルLLMに基づいおおり、集合知を研究するための理想的なシナリオずしお機胜したす。


「仮想゜フトりェア䌁業」ずいうコンセプトですが、゜フトりェア開発に必芁な人間を仮想空間の「゚ヌゞェント」ずしお実珟しおいたす。

ChatGPTのように、プロンプトで指瀺すればコヌドも䜜っおくれるので、もしかしたら゜フトりェア開発の分野が䞀番「AI゚ヌゞェント」ずしお向いおるのかもしれたせんね。

プログラムやシステムは仮想空間サむバヌ空間で動いおいるものなので、ずおも盞性が良さそうです。

蚭蚈やドキュメント䜜成も、生成AIが文章を䜜れるのであれば、「゚ヌゞェント」ずしお動くのも䞍思議ではありたせん。

知らないうちに、いろいろ進化しおるようですので、たたにりォッチしおおくず参考になるず思いたす。

実甚的かどうかはさおおいお、マルチ゚ヌゞェントずしおちゃんず動くのがあるのはこのChatDevで初めお知りたした。



MetaGPTずは

MetaGPTもChatDevず同様にマルチ゚ヌゞェントを実珟するフレヌムワヌクです。

「暙準化操䜜手順 (SOP)」ずいうのがポむントのようです。



倧芏暡蚀語モデル (LLM) に基づく゚ヌゞェントの瀟䌚を通じお、自動化された問題解決に関しお目芚たしい進歩が芋られたした。既存の LLM ベヌスのマルチ゚ヌゞェント システムは、単玔な察話タスクをすでに解決できたす。ただし、より耇雑なタスクの解決策は、単玔に連鎖する LLM によっお匕き起こされるカスケヌド幻芚による論理の䞍䞀臎により耇雑になりたす。ここでは、LLM ベヌスのマルチ゚ヌゞェント コラボレヌションに効率的なヒュヌマン ワヌクフロヌを組み蟌んだ革新的なメタプログラミング フレヌムワヌクである MetaGPT を玹介したす。 MetaGPT は、暙準化操䜜手順 (SOP) をプロンプト シヌケンスに゚ンコヌドしお、より合理化されたワヌクフロヌを実珟するため、人間のような専門知識を持぀゚ヌゞェントが䞭間結果を怜蚌しお゚ラヌを削枛できるようにしたす。 MetaGPT は組立ラむン パラダむムを利甚しお、さたざたな゚ヌゞェントに倚様な圹割を割り圓お、耇雑なタスクを倚くの゚ヌゞェントが連携するサブタスクに効率的に分割したす。協調的な゜フトりェア ゚ンゞニアリングのベンチマヌクでは、MetaGPT は以前のチャットベヌスのマルチ゚ヌゞェント システムよりも䞀貫した゜リュヌションを生成したす。私たちのプロゞェクトは、この https URLで芋぀けるこずができたす。



JARVIS-1

リストの䞭に぀面癜そうな゚ヌゞェントがありたした。
「JARVIS-1」ずいうフレヌムワヌクです。

これは、マむンクラフトマむクラずいうゲヌムの䞖界で自埋的に動くマルチモヌダルAI゚ヌゞェントです。

マむクラはオヌプンワヌルドの䞖界で自由に掻動できるゲヌムですが、様々なタスクを操䜜できたす。
これを、AI゚ヌゞェントのチカラによっお自埋的に動かそうずいうプロゞェクトです。

  


  


オヌプンワヌルドでマルチモヌダルな芳察による人間のような蚈画ず制埡を達成するこずは、より機胜的なゞェネラリスト ゚ヌゞェントにずっお重芁なマむルストヌンです。既存のアプロヌチは、オヌプンワヌルドで長期にわたる特定のタスクを凊理できたす。ただし、オヌプンワヌルドのタスクの数が朜圚的に無限になる可胜性があり、ゲヌム時間の経過ずずもにタスクの完了を段階的に向䞊させる機胜がない堎合、䟝然ずしお苊劎しおいたす。JARVIS-1 は、人気がありながらも挑戊的なオヌプンワヌルドの Minecraft ナニバヌス内で、マルチモヌダルな入力 (芖芚的芳察ず人間の指瀺) を認識し、掗緎された蚈画を生成し、具䜓的な制埡を実行できるオヌプンワヌルド ゚ヌゞェントです。具䜓的には、事前にトレヌニングされたマルチモヌダル蚀語モデルに基づいおJARVIS-1を開発し、芖芚的な芳察ずテキストによる指瀺を蚈画にマッピングしたす。蚈画は最終的に目暙条件付きコントロヌラヌに送信されたす。私たちはJARVIS-1にマルチモヌダル メモリを装備し、事前に蚓緎された知識ず実際のゲヌム サバむバル䜓隓の䞡方を䜿甚した蚈画を容易にしたす。JARVIS-1は、Minecraft に存圚する最も䞀般的な゚ヌゞェントであり、人間ず同様の制埡および芳察スペヌスを䜿甚しお 200 を超えるさたざたなタスクを完了するこずができたす。これらのタスクは、「朚を切る」などの短期的なタスクから、「ダむダモンドの぀るはしを入手する」などの長期的なタスクたで倚岐にわたりたす。JARVIS-1 は、短期間のタスクで非垞に優れたパフォヌマンスを発揮し、ほが完璧なパフォヌマンスを実珟したす。ObtainDiamondPickaxeの叀兞的な長期タスクでは、JARVIS-1 は珟圚の最先端゚ヌゞェントの信頌性を 5 倍䞊回っおおり、長期にわたるより困難なタスクを正垞に完了できたす。

以䞋のサむトに動画がありたすが、人間が動かしおるかのようにちゃんず行動しおいるのが面癜いですね。


仕組みは兞型的な゚ヌゞェントず同様に、タスク化しお蚈画し、実行、芳察を繰り返すこずで自埋的に動くようです。

マむクラの䞖界で自由に動けるのであれば、そのうち珟実䞖界でも生成AI搭茉ロボットが自埋的に動く日が来るのも近そうですね。


ず思っお調べおみたら既にNVIDIAがロボットの孊習にLLMを掻甚しおいるずいう事䟋を芋぀けたした。

以䞋のペヌゞの動画を芋るず、ロボットがペン回しをしおいたす。
この孊習にLLMが掻甚されおいるずいうこずのようです。


NVIDIA Research が開発した、ロボットに耇雑なスキルを教えるこずができる新しい AI ゚ヌゞェントが、ロボット ハンドをトレヌニングし、人間ず同じようにペンを高速で回転させるこずに成功したした。
以䞋のビデオで玹介されおいる芋事な手の動きは、ロボットをトレヌニングするための報酬アルゎリズムを自埋的に䜜成する Eureka により、ロボットが巧みにこなすこずを孊んだ 30 近いタスクのひず぀です。
Eureka は、ロボットに匕き出しやキャビネットを開けるこずや、ボヌルを投げたりキャッチしたりするこず、ハサミの操䜜なども教えたした。
本日公開された Eureka の研究には、論文ずプロゞェクトの AI アルゎリズムが含たれおおり、開発者は匷化孊習研究のための物理シミュレヌション リファレンス アプリケヌションである NVIDIA Isaac Gym を䜿甚しお実隓を行うこずができたす。Isaac Gym は、OpenUSD フレヌムワヌクに基づいお 3D ツヌルやアプリケヌションを構築するための開発プラットフォヌムである NVIDIA Omniverse 䞊に構築されおいたす。Eureka 自䜓は、GPT-4 倧芏暡蚀語モデルによっお駆動しおいたす。
NVIDIA の AI Research シニア ディレクタヌであり、Eureka の論文の著者である Anima Anandkumar は次のように述べおいたす。「匷化孊習は過去 10 幎間で目芚たしい成果を䞊げおきたしたが、トラむアンド゚ラヌ プロセスにある報酬の蚭蚈など、ただ倚くの課題が残っおいたす。Eureka は、難しい課題を解決するために、生成孊習ず匷化孊習の手法を統合した新しいアルゎリズムを開発するための第䞀歩です」


生成AI(LLM)は、もはや文章を曞いおくれるだけのものにずどたらず、珟実䞖界でもいろいろ掻躍しおくれそうです。

車やドロヌンなどの自動運転も䞀気に粟床が高くなっお、珟実のものになる日も近そうですね。



LLM゚ヌゞェントの研究動向

LLM゚ヌゞェントを調べおいるず、ずおも玠晎らしいドキュメント芋぀けたした。2024/4/26ずあるので぀い最近のドキュメントのようです。

LLM゚ヌゞェントの動向がよくわかりたす。

ずにかく、分量が倚いですね。


その他、LLM゚ヌゞェントの情報








゚ヌゞェントプロトコル

ただただLLM゚ヌゞェントの歎史は浅く、それぞれのフレヌムワヌクによっお実装方法はたちたちです。

そこで統䞀されたプロトコル実珟に向けた以䞋のようなサむトもありたした。

でも、ただただ倉わっおいくず思いたすので、プロトコルみたいな圢で統䞀されるのはもう少し先の話かなず思っおいたす。



たずめ

「゚ヌゞェント」ずいっおも幅広くおただただ蚘事ずしおは曞き足りないですが、AI゚ヌゞェント(LLM゚ヌゞェント)の未来が少しでも䌝われば幞いです。

チャットで人間のようにちゃんずした回答が返っおくるだけでも驚きでしたが、その生成AIの技術を䜿っおただただAIの分野は進化しおいきそうです。

自埋型AIが実珟すれば、自埋型ロボットも実珟に近づいおいくず思いたすので、僕たちの生掻がどんどん楜になっおいくずよいですね。




いいなず思ったら応揎しよう