見出し画像

AIエージェント運用の進化:Prosus AIチームの視点

AIエージェントが今、ホットな話題となっています。この最新技術は、ビジネスや日常生活において大きな変革をもたらす可能性を秘めています。今回は、AIエージェントについて必見の内容をお届けします。基本的な理解から、業界の最新動向、主要なプレイヤーまで、体系的に解説していきます。Prosus AIチームの経験をもとに、エージェント運用の未来を探るこの特集をお見逃しなく!

https://www.prosus.com/news-insights/group-updates/2024/ai-agentops-landscape

AIエージェントの理解

AIエージェントとは、ユーザーの指示に基づき自律的に意思決定を行い、行動を起こす高度なシステムです。これらのシステムは以下の4つの主要なコンポーネントで構成されています。

  1. 大規模言語モデル(LLM):ユーザーの意図を理解し、目的に基づいて行動計画を作成します。

  2. ツール:ウェブ検索、ドキュメント検索、コード実行、データベース統合などの機能を提供し、エージェントが具体的な行動を実行できるようにします。

  3. メモリ:長期記憶(データベースへのアクセス)と短期記憶(アクションプラン完了のための特定情報保持)の両方を含みます。

  4. 反省と自己評価:エージェントが自身のミスを発見し修正する能力を持ち、ステップの優先順位を再設定します。

エージェントシステムの進化

エージェントシステムの洗練度は、ツールの数と質、使用されるLLM、ワークフローの制約と制御により異なります。下図(LLMからエージェントへの進化)では、シングルターンチャットボットとエージェントの比較を示しています。

エージェントシステムを構築する理由

エージェントシステムを構築する理由は、現存するAIコパイロットの限界にあります。現在のAIコパイロットは、主にシングルターンのタスク(例:「このテキストを要約して」「このコードを完成させて」)に限定されています。対照的に、エージェントは複雑なマルチホップタスク(例:「最高のランニングシューズを見つけて購入して」「この年次報告書を分析して会社の成長可能性について見解を提供して」)を完了することができます。

AgentOps Ecosystem

AgentOps

  • Orchestration

    • AGiXT

  • Cognitive Layer

    • HONU

  • Multi-agent systems

    • Holistic

    • CrewAI

    • MultiGPT

    • ChatArena

    • AutogenAI

    • AI Legion

    • LANGROID

  • Front end

    • Vercel

    • Agentlabs

    • coframe

Short-term memory

  • Vectara

Long-term memory

  • VectorDBs

    • Pinecone

    • upstash

    • qdrant

    • milvus

    • Weaviate

  • Other

    • LlamaIndex

    • MemGPT

OS Agent Hubs

  • Hugging Face

  • Github

Tools & Plug-ins

  • GenAI APIs

    • stability.ai

    • OpenAI

    • ElevenLabs

    • agentZ

    • Gladia

    • Tavily

  • 3rd Party Plug-ins

    • Expedia

    • Zapier

    • Perplexity

    • WolframAlpha

    • LangSmith

  • Tool Libraries / Aggregators

    • OpenAI Assistant

    • ADEPT

  • Build Your Own Tools

    • Yeager.ai Agent

Prompt engineering & management

  • Keytalk.ai

  • Git Assistant

  • LangSmith

  • PromptPerfect

  • PROMPTSTASKS

  • PR MPMPTEHEUS

  • pezzo

Frameworks

  • LangChain Agents

  • ChatArena

  • Hugging Face Agents

  • AutogenAI

  • LANGROID

  • haystack by deepset

LLM routers

  • Martian

  • notdiamond

OS LLMS & Model training

  • Mosaic

  • Hugging Face

  • KISTRAL AI

  • together.ai

  • Forefront

  • LAMINI

  • anyscale

  • ABACUS.AI

  • Predibase

Closed source LLMS

  • ADEPT

  • Imbue

  • Agile Loop

  • Hugging Face

  • OpenAI

  • ANTHROPIC

  • Google DeepMind

  • Cohere

  • Holistic

Infra

  • Cloud platforms

    • Hugging Face

    • Microsoft Azure

    • Google Cloud

    • AWS

    • OVHCloud

    • Mosaic

  • Compute hardware

    • Google

    • Microsoft

    • Amazon

    • NVIDIA

    • Meta

  • Agent sandbox

    • E2B

  • Serverless AI

    • Banana

エージェントの課題

エージェントが非常に優れているなら、なぜすべてのAIインタラクションが既にエージェントを使用していないのでしょうか?その理由は、技術の成熟度、エージェントシステムのスケーラビリティ、ツールと統合の面で大きなハードルが存在するからです。

  • 技術の成熟度:エージェントシステムの開発には、高度な技術と多大なリソースが必要です。

  • スケーラビリティ:大規模なエージェントシステムの運用には、効率的なスケーリングが不可欠です。

  • ツールと統合:多様なツールとシステムの統合には複雑な技術的課題があります。

特定タスクや業界向けエージェントの機会

エージェントは特定の分野やタスクに特化することで、より優れたパフォーマンスを発揮します。例えば、会話型データ分析を支援するタスク特化型エージェントを構築し、組織内の誰もがデータベースをクエリする方法を知らなくても内部データにアクセスできるようにしました。このアプローチにより、特定の高インパクトユースケースにおいて回答の正確性が50%から100%に向上しました。

エージェント運用(AgentOps)の未来

効果的なエージェントを作成するには、ツールの構築、実行環境の構築、システムとの統合、計画と自己反省のレベルを有効にすることが必要です。エージェント運用(AgentOps)の概念は、AIエージェントの構築とスケーリングにおける技術的障壁を減らすための事前構築された能力とツールのセットを提供することを目的としています。

Agents Landscape

Distribution

  • There's an AI for That

    • OpenAI

    • HONU

  • Marketplaces

    • AgentSea / Kentauros AI

    • AGENTS.WTF

    • multiply (sharing agents internally)

Agents

General

  • Low / No Code

    • Low Code

      • Superagent

    • No Code

      • Respell

      • Spell

      • Kili

      • Lindy

      • Azara

      • AgentGPT

      • AIA Flow

      • Synthflow

      • Relevance AI

    • Low Code

      • Plasmic

      • Xpress AI

      • Capably

      • tray.io

      • OpenAI

      • lingual

      • Promptly

      • beam

  • Personal assistants / productivity

    • OpenAI

    • Copilot

    • toqan

    • taskode

    • Ema

    • Cognosys

    • AGENTSCALE AI

    • Amie.so

    • liaise.me

    • Agent Herbie

    • Agent Meetly

  • Web-browsing Agent

    • OpenAI

    • ADEPT

    • MultiOn

Verticalized

  • Insurance

    • muffintech

  • Finance

    • ARKIFI

    • thema

    • Defog

    • FINSTER AI

  • EdTech

    • Flint

    • HEIGHTS AI

    • ChemCrow by LangChain

  • Healthcare

    • Hippocratic AI (Do No Harm)

    • TORTUS

    • HEALTH FORCE

    • Defog

  • Law

    • Wordsmith

  • Other

    • Various verticalizations

      • Holistic

      • Hybridity

Function-specific / Horizontal

  • Customer service

    • SIERRA

    • AgentsForce

    • parloa

    • Brainfish

    • four40

    • PolyAI

  • Design

    • Websites

      • Butternut AI

    • Graphic design

      • Diagram

    • UI

      • AskUI

  • Data analysis

    • Numbers Station

    • AskYourDatabase

    • myko

    • TalktoData

    • Dot

    • MemGPT

    • Julius

    • Vanna.AI

  • Sales & Marketing

    • multiply

    • 11e

    • AskToSell

    • momentum

    • luna.ai

    • Artisan

    • airs

    • Trigify

  • eCommerce

    • airkit.ai

    • HR

      • Juno

      • HR Chatbot

  • Coding / SW

    • Sourcegraph

    • stackoverflow

    • SAGITAL.AI

    • Pythagora

    • GitHub Copilot

    • devGPT

    • Fine

    • aiko

    • AIKCO

    • Codium

    • CodeStory

    • devGPT

    • Fine

    • Lovable

    • autopilot

    • SECOND

結論

AIエージェントはまだその初期段階にありますが、その潜在的な変革力は明らかです。エージェント運用の現在の状況を理解し、エージェントを焦点領域に基づいて分類し、その発展を注視することで、将来の進歩を予見することができます。Prosusチームは、エージェント運用ツールを活用して、次世代のToqanエージェントやProsusポートフォリオ企業の製品に研究成果を取り入れ、AIエージェントの未来を切り開くことを目指しています。





いいなと思ったら応援しよう!