【生成AI月例短信2024年10月】Claude 3.5 Sonnet(new), ノーベル賞, swe-bench+
2024年10月の気になる変化を書き留めておきます。備忘録でもあります。
大規模言語モデル
Anthoropicが Claude 3.5 Sonnetの新モデルとClaude 3.5 Haikuを発表。生成AIからコンピュータを操作するComputer Useをβリリース ([itmedia3])
AppleがGSM-Symbolicの研究論文で大規模言語モデルの限界を指摘 ([itmedia2], [note])
ノーベル賞
機械学習の基礎がノーベル物理学賞をGoogle DeepMindのAlphaFoldがノーベル化学賞を受賞 ([type])
ソフトウェア開発
SWE-bench+の論文でSWE-benchがチートの可能性があり、また、試験が弱くて正解でないものを正解にする可能性が指摘される( [aleithan])
資金調達
OpenAIの最新資金調達が完了、時価総額は1500億ドルに達する ([itmedia])
むすび
いよいよGemini 2.0も o1(previewでない方)も出そうです。
米大統領選挙終了を待っているとのうわさもある生成AIの次の段階が楽しみです。
参考文献
[aleithan] SWE-Bench+: Enhanced Coding Benchmark for LLMs by Reem Aleithan, et al. https://arxiv.org/abs/2410.06992 2024年
[itmedia] OpenAI、66億ドルの資金調達 評価額は1570億ドル https://www.itmedia.co.jp/news/articles/2410/03/news091.html
[itmedia2] 「現在のLLMに真の推論は困難」──Appleの研究者らが論文発表 https://www.itmedia.co.jp/news/articles/2410/13/news070.html 2024年
[itmedia3] Anthropic、「Claude 3.5 Sonnet」更新と「Claude Haiku 3.5」リリースを発表 https://www.itmedia.co.jp/news/articles/2410/23/news104.html 2024年
[note] 数学に挑むAI!GSM-Symbolicで見えたLLMsの限界とその未来✨」https://note.com/life_to_ai/n/n1d572fd4bea5 2024年
[type] 史上最も異例な年? 2024年ノーベル賞はなぜ“AI祭り”なのか今井翔太が全力解説! https://type.jp/et/feature/26928/ 2024年