生成AIのLLMランキングが再び入れ替り

2024年11月22日 15:52

はじめに

昨日、11月21日に、Difyの最新版v0.11.2について、記事をnoteに出しました。そこで、昨日の朝と午後で、LLMのランキングが入れ替わってるのをChatnotArenaのランキングで示しました。
今朝、みてみたら、またまた、入れ替わってる、というかGoogleの新モデルが新たに登場し、OpenAIの昨日の新モデルを抜いちゃってました。
びっくりしたので、メモっとこうと思います。

Googleの新モデルがさらに登場

モデル名は、Gemini Experimental 1121 （Gemini-Exp-1121）、前のモデルのGemini Experimental 1114（Gemini-Exp-1114と同様、日付をつけて登場です。

一方、ライバルの（といっていいんでしょうね、こうなったら）OpenAIのモデル名は、ChatGPT-4o-latest (2024-11-20)、1日違いです。
巻き返されたら巻き返す。
なんか、すごいことになりつつあります。

ちなみに、Gemini Experimental 1121は、Google AI StudioのLLM選択肢に既にのっていて使えます。OpenAIは、LLMの選択には、Chat GPT4oとしか記載されていないので、一見したところ状況は不明です。

ChatnotArenaのランキング状況

11月22日のランキング（7:59)

ちなみに、11/22 15:05も状況は同じでした。

前回の記事で引用した11/21の状況を以下に再掲します。

11月21日 7:57 のランキング（Chatbot Arena)

https://lmarena.ai/?leaderboard

11月21日 15:34のランキング（Chatbot Arena)

https://lmarena.ai/?leaderboard

11月21日の午後になって、Chat-GPT-4o-Latest(2024-11-20)が登場して、1位になっています。

今後、どうなる？

OpenAIの新モデルは、一日天下どころか、半日ぐらいで一位の座を引きずり降ろされたわけです。

明日、というか、今晩の状況はどうなるのでしょう。なんせ、金曜日、ブラックフライデーですから。お休み返上ですかね。

一方、一番上の表で、紫で囲んだジワッと伸びてきているGrokなどの7位勢は、どうするんでしょうか。

特に最近急速にランクインしてきている01 AI、Zhipu AI、Alibaba，DeepSeekなどの中国勢の動向が今後は注目されます。