【生成AI月例短信2024年10月】Claude 3.5 Sonnet(new), ノーベル賞, swe-bench+

2024年11月4日 10:09

2024年10月の気になる変化を書き留めておきます。備忘録でもあります。

大規模言語モデル

Anthoropicが Claude 3.5 Sonnetの新モデルとClaude 3.5 Haikuを発表。生成AIからコンピュータを操作するComputer Useをβリリース ([itmedia3])
AppleがGSM-Symbolicの研究論文で大規模言語モデルの限界を指摘 ([itmedia2], [note])

いよいよGemini 2.0も o1（previewでない方）も出そうです。
米大統領選挙終了を待っているとのうわさもある生成AIの次の段階が楽しみです。

[aleithan] SWE-Bench+: Enhanced Coding Benchmark for LLMs by Reem Aleithan, et al. https://arxiv.org/abs/2410.06992 2024年
[itmedia] OpenAI、66億ドルの資金調達　評価額は1570億ドル　https://www.itmedia.co.jp/news/articles/2410/03/news091.html
[itmedia2] 「現在のLLMに真の推論は困難」──Appleの研究者らが論文発表 https://www.itmedia.co.jp/news/articles/2410/13/news070.html 2024年
[itmedia3] Anthropic、「Claude 3.5 Sonnet」更新と「Claude Haiku 3.5」リリースを発表 https://www.itmedia.co.jp/news/articles/2410/23/news104.html　2024年
[note] 数学に挑むAI！GSM-Symbolicで見えたLLMsの限界とその未来✨」https://note.com/life_to_ai/n/n1d572fd4bea5 2024年
[type] 史上最も異例な年？ 2024年ノーベル賞はなぜ“AI祭り”なのか今井翔太が全力解説！　https://type.jp/et/feature/26928/　2024年