大規模言語モデル(LLM)やそのツールの情報整理2024.08版
OpenAIって出始めの頃よりもマーケティングのうまさが目立ってきている。どこかの記事の分析では競合のプレスにかぶせる形で自社のプレスを出したりとか。GPT-4o mini: advancing cost-efficient intelligenceとか、まぁそれだけのものを出しているのは間違いないのだけど。
金額が以前の1/9になるのも驚きだが、自分の業務で気になるのはリサーチで頼ってるperplexityの競合SearchGPTというのを出すとか。他にもいろいろラストワンマイル的な製品を出しているようで。
GAFAMで真正面から対抗できるのはやはりgoogle「Gemini」かなぁ、workspaceとかの拡張機能に使ってMS+openAIの仕組みを上回ろうとしたり、メモ作成機能なんかもできたらだいぶ良いよなぁ。
Googleは数学の問題を解くAIも進化させている。高度処理能力のベンチマークとして個人的にはかなり気になる観点で、OpenAIがすごいのはわかっていつつ、やはりAIはgoogleだなぁと思ってしまう。
もちろん他の企業も動きはあるので併せて紹介。
Sakana AIは更に一歩進んで、AIが自ら研究する「AIサイエンティスト」を出してきたけれど、かなりビミョーな評価もされているので、すぐに使えるかというと話半分で。でも取り組みとしての面白さは素晴らしいと思う。
その他、Meta「Llama 3.1」とか競合を。暗黙の裡にLLMを対象にチェックしていたけど、人物Image to Videoの進化もすごい。
これまでGAFAMのうち動きが見えてなかったAppleについての記事があったので追記。
日本語ローカルLLMたちについての動きを。ただ今の日本政府が推進・優遇策を出してくれてるからか、OpenAIやGoogleなんかのAIは日本語対応ちゃんとしてくれてる気がするので、もしかしたら方向性としてはドメイン特化した方がビジネスとしては良いのかも。こちらは最近あまり見かけないなぁ。
あとAIエージェントの方も以前取り上げたdevin以外にも出てるようで
実務におけるRAG もだいぶ進歩してきましたからねー
最近では評価の仕方についても進展しているようで・・・
「モデル崩壊」の指摘は興味深い。たぶんウェブサイトなんかでもLLMに執筆させたものがあるだろうしww
ちょっと面白そうな事例を最後にあげて、この記事を終わります。
でもまぁ最近見た中でどれか1つだけ読め、となったらこれ↓かも。