大規模言語モデル(LLM)やそのツールの情報整理2025年始版

2025年1月13日 21:00

年始版と書いてるけど、これまで集めていた情報を年末年始に整理したというだけ、2024年末版と同様にただのタイミングですww
意図のある記事は既に2025年はAIエージェントのビジネス実装が本格化するんだろうなのようにまとめていますが、その補足としてbrowser useの利用シーンから

【悲報】寝てる間にAIが職探しを終わらせる

AIエージェントに『俺の履歴書見て、向いてそうな会社探して』と指示するだけで自動で履歴書を見て、合いそうな仕事をネットで検索して応募まで完遂。そのうち実務までAIが行えば人が働く時代終わるかも。数年後に実現かな… ↓pic.twitter.com/d1UZVLtetd
— チャエンデジライズ CEO重要AIニュースを毎日最速で発信⚡️ (@masahirochaen) January 4, 2025

あ、すげえ。Claudflareの「あなたは人間ですか？」のチェックボックス、こんなん意味あるんか？とずっと思ってたけどbrowser-useのGeminiはあのチェックボックスがどうしてもクリックできなくて諦めた。あれちゃんとAI避けになってるんだな
— うみゆき@AI研究 (@umiyuki_ai) January 3, 2025

Devinを試すか社内で若手と相談しようと思ってたが、ソフトウェア開発エージェントAIを試すなら、もっと良さげなClineを見つけた。
最近だと「computer use」「Model Context Protocol」を出してたAnthropic社が開発したAIエージェントで、Visual Studio Code(VS Code)などの統合開発環境(IDE)上で動作するようだ。

どうやら当面はClineが一番仕事に取り込みやすそう

DevinやAllHands AI、Claude DesktopのMCP連携、Browser-useなどを触っていたのだが、そんな中でも現時点で一番「もう戻れねえな」と思ったのはCline。ChatGPTにソースコードコピペしながらプロンプトをしこしこ書いて手元で実行していた時代がまるで石器時代のように感じる
— 安野貴博 @ 新刊『1％の革命』が2/6発売予定です！ (@takahiroanno) January 6, 2025

その他ソフトウェア開発のエージェントAIを

一応このあたりベンチマークしてくれるサイトはある。完全な自動化はまだ不可能で、コーディングでは可能性はあるが、人とAIの共存が必要っぽい。みたいな要約はコチラがわかりやすい（長文のツイートはnoteに貼ると見栄えが悪い気がしてww）

実際、AIに「もっといいコードを書いて」と繰り返し要求するとコードの実行速度は向上するがバグが増えるらしい。なので、エージェントAIが爆速で開発するのを横で見てツッコミを入れる役割は必要なのでしょう。それでも生産性が圧倒的に高まれば問題ないけれど。

AIモデルの方でも年初に「DeepSeek-V3」の情報が来た、GPT-4oに匹敵するのだとか。オープンソースで使えるそうだが、必要なCPU/GPUを考えるとうちの会社じゃやりづらいww

ただ、まぁ、中国製ゆえの注意点はかなりありそうだけど＿|￣|○

DeepSeek V3は中国製なので倫理や政治、教育には向かない。 pic.twitter.com/Vq8M6sFg1Z
— 高木祐介(takagi yuusuke)@株式会社自動処理 (@tiger57479976) January 6, 2025

DeepSeek https://t.co/s0VgvM3HwI
・入力内容と出力内容は、サービス改善のために使用される可能性があります
・データは中国本土のサーバーに保存され、中国の法規制の対象となります
・（中国の）法執行機関などへの情報提供が必要になる可能性があります…
— 平岡憲人(ノーリー: HIRAOKA, Norito) Stand with Ukraine (@onokoro48) January 7, 2025

仕事もあってチャットボット系を少し調べていた、個人的にはFeloが最近使いやすくなってきてる感じがしていて、マイエージェントってのがperplexityより良いが、マインドマップはgensparkの方がスゴくなって、どこも一長一短だよなー

🌟 Felo 3.0 マイエージェント登場！
検索エージェントをカスタマイズして作成可能！ ✨

1️⃣ 自分の検索エージェントを作成
→ 研究の手順や目的を入力するだけで、目的に沿った検索エージェントを作成できます！
2️⃣ レポート生成で作業効率UP
→… pic.twitter.com/v3HHuwSLWO
— Felo（AI Search Agent) (@felo_ai) January 10, 2025

などと思っていたら、ChatGPT、Grok、PerplexityなどもAIエージェントを使ってジェネリックが簡単にできてしまう、進歩が速すぎる。。。

AIエージェントを使って、検索に強い生成AI「Perplexity」をたった2時間でほぼ完コピしたニキが登場。

最新の生成AI使えば、デザインも裏側も簡単にコピーできる。恐ろしい時代。

作り方詳細とデモ⇩

pic.twitter.com/oNhXoIU1Ub
— チャエンデジライズ CEO重要AIニュースを毎日最速で発信⚡️ (@masahirochaen) January 4, 2025

ChatGPT、Grok、Perplexityに課金はもう不要？
無料でオープンソースの検索に強い生成AI「MiniPerplx」が超便利。

X投稿、Youtube、ウェブ検索、画像解析が可能な無料のAIチャットボット。普通に精度も高く、UI・UXも非常に良い。

Feloやパープレの代わりになりそう

技術仕様とデモはこちらから↓ pic.twitter.com/BrN0EOHJ7l
— チャエンデジライズ CEO重要AIニュースを毎日最速で発信⚡️ (@masahirochaen) January 6, 2025

読み込ませるデータの整備についても、MicrosoftがMarkItDownって形で整備している、詳細はmicrosoft/markitdown: Python tool for converting files and office documents to Markdown.、ザックリとは以下。パワポで表を書くとき、腐れコンサルはやたらボックスオブジェクトを使って作成するけど、そんな表面上ややキレイに見えるだけの自己満足より、AIに読み込ませる（markdown等に変換できる）ことを優先して表オブジェクトで作れよ！がスタンダードになるかも？

なんか、もうAI関連の技術は指くわえてみてれば技術は勝手に進展するので、AIが環境構築や実装、テストなどを遂行できるように業務のあれこれを略さずドキュメント化する、そもそもの知識として整備することの方が人にとって不可欠なんだろうなぁ。

テック動向を少し。MicrosoftはazureからAI Agentというかcode interpreter使えたのか、休み明けに試してみるか→うちの契約だとダメだた…。

cohereがエンタープライズ用途のAIプラットフォーム出すのね。ここまでは手が出せないけれど、情報だけ把握を。

情報過多になってきたので、もう少し集めていた情報はまた別の記事「エージェントAIのフレームワークや技術レファレンスまとめ」に移しました。

大規模言語モデル(LLM)やそのツールの情報整理2025年始版

いいなと思ったら応援しよう！