大規模言語モデルがPythonツールを作成し自ら活用するフレームワーク「LATM」
論文:https://doi.org/10.48550/arXiv.2305.17126
GitHub:https://github.com/ctlllll/LLM-ToolMaker
上記でも紹介しました。
研究詳細:
Deep Mind、プリンストン大、スタンフォード大の研究者らにより、大規模言語モデル(LLM)の問題解決能力を向上させるための新たなフレームワーク「LATM」が提案されました。
LLMが自身で再利用可能なツールを作成し、問題解決に活用することを可能にするものです。
ここでのツールはPythonのユーティリティ関数(再利用可能なコードユニット)として実装されます。
このフレームワークは主に2つのフェーズから構成されています。
1つ目は「ツール作成」で、LLMが特定のタスクのためのツールを作成します。
2つ目は「ツール使用」で、作成したツールをLLMが問題解決のために使用します。
このプロセスは自動化され、ツールメーカーとツールユーザーの間のコミュニケーションは内部的に行われるとのこと。
なお、リソースを大量に消費する強力なモデル(GPT-4など)をツールメーカーとして、軽量でコスト効率の良いモデル(GPT-3.5など)をツールユーザーとして使用することで、コスト効率と品質の両方を維持できます。
AIの能力とその活用の幅を広げる新たな可能性が示されましたね。
いいなと思ったら応援しよう!
より良質な記事をお届けするための取材費に使います!