見出し画像

【生成AI月例短信2024年12月】o1, o3, Gemini 2.0 Flash、Veo 2、スキーミング

2024年12月の気になる変化を書き留めておきます。備忘録でもあります。1ヶ月前のことが昔のことのように思われる変化の月でした。


基盤モデル

  • o1がリリース OpenAIが2024年9月にリリースしていたo1-previewの本格版をリリースしました[ai-souken]。

  • Gemini 2.0 Flashがリリース GoogleがOpenAIに匹敵するモデルGemini 2.0 Flashをリリースしました[itmedia2]。チャットボットアリーナでOpenAIから首位を奪い返しました。

  • o3が発表 OpenAIがo1の後継機種で高度な学術・推論が可能なo3を発表しました [wired]。従来2%しか解けなかったFrontier Mathを25%解け、SWE-bench verifiedで70%を達成すると発表しています。

動画モデル

  • Googleがリアルタイムにゲームエンジンなしでプレイ可能な3Dゲームを生成するGinie 2のデモ動画を発表 ([itmedia])。

  • OpenAIが動画生成AI Soraを一般にリリース ([bloomberg])。

  • Google DeepMindがSoraを上回る Veo 2をリリース ([itmedia3]。

システム・プロトコル

  • Cognitionが自律ソフトウェア開発エージェントDevinの月500米ドルの商用版をリリース ([codezine])。

  • AnthoropicがAIエージェントとシステムのプロトコルMCPを発表 ([anthoropic])。

  • [codezine] Cognition、完全自律型AIソフトウェアエンジニア「Devin」を正式リリース https://codezine.jp/article/detail/20652 2024年12月

  • OpenAIが月額2000米ドルのproモードを発表([itmedia4])。

生成AIの安全性

  • Apollo Researchが大規模言語モデルにスキーミング(欺瞞)の能力があることを研究発表 ([zdnet])

  • Anthropicが大規模言語モデルがアラインメントを偽装することを研究発表 ([note])

むすび

OpenAI o3はまだリリースされていませんし、直近のリリースはo3-miniになりそうです。1回の推論に数千ドルかかるといわれていますので、人類を脅かすのはまだ先になりそうです。先といっても数年と予想されます。激動の2024年を締めくくるのにふさわしい12月でした。

参考文献


いいなと思ったら応援しよう!