大規模言語モデル(LLM)やそのツールの情報整理2025年始版

年始版と書いてるけど、これまで集めていた情報を年末年始に整理したというだけ、2024年末版と同様にただのタイミングですww
意図のある記事は既に2025年はAIエージェントのビジネス実装が本格化するんだろうなのようにまとめていますが、その補足としてbrowser useの利用シーンから

Devinを試すか社内で若手と相談しようと思ってたが、ソフトウェア開発エージェントAIを試すなら、もっと良さげなClineを見つけた。
最近だと「computer use」「Model Context Protocol」を出してたAnthropic社が開発したAIエージェントで、Visual Studio Code(VS Code)などの統合開発環境(IDE)上で動作するようだ。

どうやら当面はClineが一番仕事に取り込みやすそう

その他ソフトウェア開発のエージェントAIを

一応このあたりベンチマークしてくれるサイトはある。完全な自動化はまだ不可能で、コーディングでは可能性はあるが、人とAIの共存が必要っぽい。みたいな要約はコチラがわかりやすい(長文のツイートはnoteに貼ると見栄えが悪い気がしてww)

実際、AIに「もっといいコードを書いて」と繰り返し要求するとコードの実行速度は向上するがバグが増えるらしい。なので、エージェントAIが爆速で開発するのを横で見てツッコミを入れる役割は必要なのでしょう。それでも生産性が圧倒的に高まれば問題ないけれど。

AIモデルの方でも年初に「DeepSeek-V3」の情報が来た、GPT-4oに匹敵するのだとか。オープンソースで使えるそうだが、必要なCPU/GPUを考えるとうちの会社じゃやりづらいww

ただ、まぁ、中国製ゆえの注意点はかなりありそうだけど_| ̄|○

仕事もあってチャットボット系を少し調べていた、個人的にはFeloが最近使いやすくなってきてる感じがしていて、マイエージェントってのがperplexityより良いが、マインドマップはgensparkの方がスゴくなって、どこも一長一短だよなー 

などと思っていたら、ChatGPT、Grok、PerplexityなどもAIエージェントを使ってジェネリックが簡単にできてしまう、進歩が速すぎる。。。

読み込ませるデータの整備についても、MicrosoftがMarkItDownって形で整備している、詳細はmicrosoft/markitdown: Python tool for converting files and office documents to Markdown.、ザックリとは以下。パワポで表を書くとき、腐れコンサルはやたらボックスオブジェクトを使って作成するけど、そんな表面上ややキレイに見えるだけの自己満足より、AIに読み込ませる(markdown等に変換できる)ことを優先して表オブジェクトで作れよ!がスタンダードになるかも?

なんか、もうAI関連の技術は指くわえてみてれば技術は勝手に進展するので、AIが環境構築や実装、テストなどを遂行できるように業務のあれこれを略さずドキュメント化する、そもそもの知識として整備することの方が人にとって不可欠なんだろうなぁ。

テック動向を少し。MicrosoftはazureからAI Agentというかcode interpreter使えたのか、休み明けに試してみるか→うちの契約だとダメだた…。

cohereがエンタープライズ用途のAIプラットフォーム出すのね。ここまでは手が出せないけれど、情報だけ把握を。

情報過多になってきたので、もう少し集めていた情報はまた別の記事「エージェントAIのフレームワークや技術レファレンスまとめ」に移しました。

いいなと思ったら応援しよう!