
【生成AI月例短信2024年11月】チャットボットアリーナリーダーボード、Sora、Replit
2024年11月の気になる変化を書き留めておきます。備忘録でもあります。
大規模言語モデル
チャットボットアリーナで 11月中旬にGemini-Exp-1114がo1-previewを逆転しました。さらに翌週、ChatGPT-4o-latest (2024-11-20)で抜き返しました。さらにGemini-Exp-1121が抜き返しました。GPT-4oの後継とGemini 2.0の後継が噂される中、激しいリーダーボード争いが栗ひげられています ([chatbotarena]).。
動画生成AI
OpenAIのSoraのアーティストの権利の扱いに反対するアーティストグループが最新のSoraを一部無断リリースしました ([ascii])。
ソフトウェア開発
2024年9月にリリースされたバックエンドの実行環境も自動で整備できるノーコードの開発環境 Replit AIが話題になりました ([chatgpt-lab])。
SWE-bench verifiedでOpenHands + CodeAct v2.1 (claude-3-5-sonnet-20241022) が53.0%の最高値を記録しました ([swebench])。
むすび
2024年11月のMicrosoft Ignite 2024でMicrosoft CEO Satya Nadellaが今後の生成AIの発展を a) マルチモーダル、b) 推論、c) メモリ、の3つで示しました ([microsoft])。2024年は音声、画像、動画の認識能力も進化し、推論能力も向上しました。コンテクストウィンドウがハルシネーションを生む障壁になっていますが、メモリの進化が進めば、これも解決しそうです。
参考文献
[ascii] OpenAIの動画生成AI「Sora」へのアクセス方法がリークされる https://ascii.jp/elem/000/004/237/4237278/ 2024年
[chabotarena] Chatbot Arena Leaderboard https://lmarena.ai/?leaderboard 2024年
[chatgpt-lab] ChatGPTlab: 最強AI開発ツール出現!Replit Agentを徹底解説 https://chatgpt-lab.com/n/nccc10e804eba 2024年
[microsoft] Microsoft: Full Keynote: Satya Nadella at Microsoft Ignite 2024 https://www.youtube.com/watch?v=3YiB2OvK6sY 1h16m19s 2024年
[swebench] SWE-bench https://www.swebench.com/ 2024年