
【生成AI月例短信2024年12月】o1, o3, Gemini 2.0 Flash、Veo 2、スキーミング
2024年12月の気になる変化を書き留めておきます。備忘録でもあります。1ヶ月前のことが昔のことのように思われる変化の月でした。
基盤モデル
o1がリリース OpenAIが2024年9月にリリースしていたo1-previewの本格版をリリースしました[ai-souken]。
Gemini 2.0 Flashがリリース GoogleがOpenAIに匹敵するモデルGemini 2.0 Flashをリリースしました[itmedia2]。チャットボットアリーナでOpenAIから首位を奪い返しました。
o3が発表 OpenAIがo1の後継機種で高度な学術・推論が可能なo3を発表しました [wired]。従来2%しか解けなかったFrontier Mathを25%解け、SWE-bench verifiedで70%を達成すると発表しています。
動画モデル
Googleがリアルタイムにゲームエンジンなしでプレイ可能な3Dゲームを生成するGinie 2のデモ動画を発表 ([itmedia])。
OpenAIが動画生成AI Soraを一般にリリース ([bloomberg])。
Google DeepMindがSoraを上回る Veo 2をリリース ([itmedia3]。
システム・プロトコル
Cognitionが自律ソフトウェア開発エージェントDevinの月500米ドルの商用版をリリース ([codezine])。
AnthoropicがAIエージェントとシステムのプロトコルMCPを発表 ([anthoropic])。
[codezine] Cognition、完全自律型AIソフトウェアエンジニア「Devin」を正式リリース https://codezine.jp/article/detail/20652 2024年12月
OpenAIが月額2000米ドルのproモードを発表([itmedia4])。
生成AIの安全性
Apollo Researchが大規模言語モデルにスキーミング(欺瞞)の能力があることを研究発表 ([zdnet])
Anthropicが大規模言語モデルがアラインメントを偽装することを研究発表 ([note])
むすび
OpenAI o3はまだリリースされていませんし、直近のリリースはo3-miniになりそうです。1回の推論に数千ドルかかるといわれていますので、人類を脅かすのはまだ先になりそうです。先といっても数年と予想されます。激動の2024年を締めくくるのにふさわしい12月でした。
参考文献
[ai-souken] OpenAI o1(ChatGPT o1)とは?使い方や料金、Proについて解説! https://www.ai-souken.com/article/what-is-openaio1 2024年
[anthoropic] Introducing the Model Context Protocol https://www.anthropic.com/news/model-context-protocol 2024年
[bloomberg] オープンAI、待望の動画生成サービス「Sora」をリリース https://www.bloomberg.co.jp/news/articles/2024-12-09/SO8RPIDWX2PS00 2024年12月
[itmedia] Google DeepMind、インタラクティブな3D世界を作るAI「Genie 2」発表 https://www.itmedia.co.jp/news/articles/2412/05/news116.html 2024年
[itmedia2] Google、「Gemini 2.0 Flash Thinking」公開 「o1」競合の“思考過程を示す”推論AIモデル https://www.itmedia.co.jp/news/articles/2412/20/news108.html 2024年12月
[itmedia3] 動画生成AI「Veo 2」──米Googleが突如発表 性能は“Sora超え”とアピール 「物理学や人間の動きを理解している」 https://www.itmedia.co.jp/aiplus/articles/2412/17/news108.html 2024年
[itmedia4] ChatGPTに“月額3万円”の新有料プラン登場 最高性能の「o1 pro mode」などAIモデル&ツール使い放題 https://www.itmedia.co.jp/aiplus/articles/2412/06/news109.html 2024年
[note]Anthropicの新しいAIモデルが嘘をつき、逃亡を試みた... https://note.com/kind_crocus236/n/n06783bdff5b0 2024年12月
[wired] OpenAI、推論能力を大幅に強化した新AIモデル「o3」を発表。AI開発競争、年末に激化 https://wired.jp/article/openai-o3-reasoning-model-google-gemini/ 2024年12月
[zdnet] OpenAIの「o1」に欺瞞の傾向--うそをつきにくいAIモデルは? https://japan.zdnet.com/article/35227116/ 2024年12月