見出し画像

AI Agentについてぼんやり考えてみる

生成AIの世界は本当にあっという間に変化します。

『2025年はAI Agentの年になる』という声をちらほら聞くようになったので、情報の整理も兼ねて『AI Agent』についてぼんやり考えることにします。


AI Agentって何?

ChatGPTにきいてみます。

AIエージェントとは、人工知能を使ってタスクを自律的に実行できるソフトウェアまたはシステムのことです。

「自律的に」というのがポイントで、人間が指示を出さなくても、環境や状況に応じて最適な行動を判断し、実行します。

具体的にどんなことができるのかさらにきいてみます。

Q. 具体的にどんなことができるのかリストアップして。PC以外の挙動は含めないで

  • 情報処理と検索

  • ファイル管理

  • 自動化タスク(定期的なデータ処理、繰り返し作業の自動実行)

  • テキスト処理 (翻訳、改善提案)

  • ソフトウェアの操作(アプリ間のデータ連携 Gmailとブラウザの連携など)

  • データ分析

  • コミュニケーション支援(会議の議事録作成)

  • デザインとクリエイティブ作業(画像・デザイン・コード)

  • ログ解析

  • 学習支援

うん。わかるようでわからん。

ということで改めて考えてみることにします。

生成AI 5段階スケール

ChatGPTで有名なOpenAIが、AGI(汎用人工知能)に至るまでの5段階のスケールというものを発表しているので記載します。

5段階のスケール
  • Level1 チャットボット、会話言語を持つAI

  • Level2 推論者、人間レベルの問題解決

  • Level3 エージェント、行動を起こせるシステム

  • Level4 イノベーター、発明を支援できるAI

  • Level5 組織、組織の仕事をこなせるAI


2022年〜2023年はChatGPT3,5やChatGPT4が登場しました。レベル1に相当します。

2024年夏に 『o1-preview』が登場しました。
こちらはまだpreviewという事で開発段階ではありますが、
短い問いを通して段階的に推論していくという事で、レベル2に相当します。

続いて来年になりますが、2025年に『Operator』なる機能を登場させると発表がありました。

5段階のスケールのうちレベル3に相当すると思われます。

続いてAI Agentの対応範囲も考えてみます。

AI Agentの対応領域

OpenAIに限らず、AI Agentという言葉を少しずつ目にするようになっています。

動作する領域に分けると今の所は、

  • コード生成分野 (replit agent, bolt.new)

  • ブラウザ操作 (operator)

  • PCの操作 (computer use)

の3つでしょうか。

コード生成は最近 びっくりするような生成結果をたくさん目にする機会が増えていますが、気になる点もどんどんと増えてきて。

ブラウザ操作やPCの操作もできるようになれば、さらにできる事が増えてくると予想されますが、同時に懸念も出てくるのでまとめてみます。

AI Agentの懸念や気になること

懸念1 コストが高い

すでにコード生成に関してはAI Agentと呼ばれるサービスが台頭していますが、少し使うとあっという間に1万円を超えます。

何度も何度もLLMに通信して動作するので、従量課金であればあっという間に数千円、数万円に届きそうな勢いです。

気軽にいつでも使えるかと言われると、遊びの範疇からはみ出すにはコストが高いなと思っています。

懸念2 オンライン限定か

AI Agent次第ですが、現状はインターネットが繋がる状態で、ブラウザ上で動くものが多いです。

例えばローカルのエクセルやメールなども見れるようになればさらにすごいと思いますが、LLMは基本的にオンラインにあるので、昔はやったマクロやRPAとは少し違うのかなと思ったりしています。

懸念3 ハード操作

懸念2と重なりますが、現状はブラウザ上でしか動かないものが多いので、
センサーや物理的なロボットアームなどを動かして、というのはまだ実用的ではない段階です。

ハードも指示通りに動かせるかというと、2025年段階ではまだ厳しいのではと思っています。

懸念4 変なことしてないよね

人の簡単な指示で予約取ったりメール送信したりできるとしたら、便利な一方で、いったい何を実行したのかというのを確認したくなります。

変なことしてないよね。と。

作業ログなど後からしっかり確認できる仕組みが必要だし、企業に導入となればこのあたりのリスク・懸念が解消されないと、導入の壁は高そうです。

まとめ

急速な勢いで進化しつつ、新しい懸念や考える事もどんどん増えている現状です。

パソコンやスマホの最初と同じで、
数年経てばいつの間にか広がっているというのは目に見えているので、

今のうちから、何ができて何がリスクでというのはぼんやり考えておきたいなと思っています。


Udemy講座 生成AIもいくつかあります(Dify, 画像生成AI, ChatGPTなど)

udemy講師紹介ページ

udemy講座のクーポン一覧


最後まで記事をお読みいただきありがとうございます❗

さらなる良記事を執筆するためのモチベーションアップのため、

よろしければスキ & フォローもお願いいたします😊

フォローバック100%させていただきます💯

いいなと思ったら応援しよう!

世界のアオキ@生成AI探究者 | 個人開発withAI | 仕事も遊びも全力でありたい
よろしくお願いします。いただいたサポート費用はクリエイターとして、レベルアップするための活動に役立てるようにいたします。ありがとうございます🥰