見出し画像

【生成AI月例短信2024年10月】Claude 3.5 Sonnet(new), ノーベル賞, swe-bench+

2024年10月の気になる変化を書き留めておきます。備忘録でもあります。


大規模言語モデル

  • Anthoropicが Claude 3.5 Sonnetの新モデルとClaude 3.5 Haikuを発表。生成AIからコンピュータを操作するComputer Useをβリリース ([itmedia3])

  • AppleがGSM-Symbolicの研究論文で大規模言語モデルの限界を指摘 ([itmedia2], [note])

ノーベル賞

  • 機械学習の基礎がノーベル物理学賞をGoogle DeepMindのAlphaFoldがノーベル化学賞を受賞 ([type])

ソフトウェア開発

  • SWE-bench+の論文でSWE-benchがチートの可能性があり、また、試験が弱くて正解でないものを正解にする可能性が指摘される( [aleithan])

資金調達

  • OpenAIの最新資金調達が完了、時価総額は1500億ドルに達する ([itmedia])

むすび

いよいよGemini 2.0も o1(previewでない方)も出そうです。
米大統領選挙終了を待っているとのうわさもある生成AIの次の段階が楽しみです。

参考文献

  • [aleithan] SWE-Bench+: Enhanced Coding Benchmark for LLMs by Reem Aleithan, et al.  https://arxiv.org/abs/2410.06992 2024年

  • [itmedia]  OpenAI、66億ドルの資金調達 評価額は1570億ドル https://www.itmedia.co.jp/news/articles/2410/03/news091.html

  • [itmedia2] 「現在のLLMに真の推論は困難」──Appleの研究者らが論文発表 https://www.itmedia.co.jp/news/articles/2410/13/news070.html 2024年

  • [itmedia3] Anthropic、「Claude 3.5 Sonnet」更新と「Claude Haiku 3.5」リリースを発表 https://www.itmedia.co.jp/news/articles/2410/23/news104.html 2024年

  • [note] 数学に挑むAI!GSM-Symbolicで見えたLLMsの限界とその未来✨」https://note.com/life_to_ai/n/n1d572fd4bea5 2024年

  • [type] 史上最も異例な年? 2024年ノーベル賞はなぜ“AI祭り”なのか今井翔太が全力解説! https://type.jp/et/feature/26928/ 2024年


いいなと思ったら応援しよう!