
生成AIのLLMランキングが再び入れ替り
はじめに
昨日、11月21日に、Difyの最新版v0.11.2について、記事をnoteに出しました。そこで、昨日の朝と午後で、LLMのランキングが入れ替わってるのをChatnotArenaのランキングで示しました。
今朝、みてみたら、またまた、入れ替わってる、というかGoogleの新モデルが新たに登場し、OpenAIの昨日の新モデルを抜いちゃってました。
びっくりしたので、メモっとこうと思います。
Googleの新モデルがさらに登場
モデル名は、Gemini Experimental 1121 (Gemini-Exp-1121)、前のモデルのGemini Experimental 1114(Gemini-Exp-1114と同様、日付をつけて登場です。
一方、ライバルの(といっていいんでしょうね、こうなったら)OpenAIのモデル名は、ChatGPT-4o-latest (2024-11-20)、1日違いです。
巻き返されたら巻き返す。
なんか、すごいことになりつつあります。
ちなみに、Gemini Experimental 1121は、Google AI StudioのLLM選択肢に既にのっていて使えます。OpenAIは、LLMの選択には、Chat GPT4oとしか記載されていないので、一見したところ状況は不明です。
ChatnotArenaのランキング状況
11月22日のランキング(7:59)

ちなみに、11/22 15:05も状況は同じでした。

前回の記事で引用した11/21の状況を以下に再掲します。
11月21日 7:57 のランキング(Chatbot Arena)
https://lmarena.ai/?leaderboard

11月21日 15:34のランキング(Chatbot Arena)
https://lmarena.ai/?leaderboard

11月21日の午後になって、Chat-GPT-4o-Latest(2024-11-20)が登場して、1位になっています。
今後、どうなる?
OpenAIの新モデルは、一日天下どころか、半日ぐらいで一位の座を引きずり降ろされたわけです。
明日、というか、今晩の状況はどうなるのでしょう。なんせ、金曜日、ブラックフライデーですから。お休み返上ですかね。
一方、一番上の表で、紫で囲んだジワッと伸びてきているGrokなどの7位勢は、どうするんでしょうか。
特に最近急速にランクインしてきている01 AI、Zhipu AI、Alibaba,DeepSeekなどの中国勢の動向が今後は注目されます。