【生成AI月例短信2024年9月】OpenAI o1, Llama 3.2
2024年9月の気になる変化を書き留めておきます。備忘録でもあります。
大規模言語モデル
OpenAIからo1-preview, o1-miniがリリースされました。推論を強化しています。IQ120レベルという報道もあり話題になっています([fragai])。個人的には事前学習をするだけでなく、推論時にも計算資源をかければかけるだけ精度が上がるというのが新鮮です。また、言語ではなく推論トークンで学習しているところもギアチェンジを感じます。
MetaからLlama 3.2がリリースされました。画像認識が加わりました。言語を扱う部分はLlama 3.1とコンパチでそのまま入れ替えられる設計になっています。
数学的基礎
Google DeepMindがTransformerの問題解決能力についての論文を発表しました([arxiv])。CoT (Chain of Thoughts: 思考の鎖)を使えば、定数の深さのTransformerが中間段階で生成されるトークンに比例した問題解決能力があることを示しました。トークンを無限に生成すれば無限に解けるということです ([ai-papers])。
資金調達
OpenAIが65億ドルの資金調達を交渉中です([cryptpolitan])。NVIDIA、Microsoftなどが交渉中です。日本ではソフトバンクも参加していると報道されています。Appleは降りたようです。この件は8月短信にも書きましたが、8月の参照記事では企業価値1000億ドルだったのが、1500億ドルになっています。東京証券取引所上場企業で比較すると勝てるのはトヨタだけになりました。(その後、2024年10月3日報道で資金調達は完了し時価総額1570億ドルとのことです ([bloomberg])xAIが5月に60億ドル調達している([bloomberg2]) のでそれと同規模の資金調達でした。
参考文献
[ai-papers] TransformerにCoTを導入することで全ての推論問題を解決できる! https://ai-papers.net/transformer-cot/
[arxiv] "Chain of Thought Empowers Transformers to Solve Inherently Serial Problems" by Zhiyuan Li, et al. https://arxiv.org/abs/2402.12875 2024年
[bloomberg] オープンAI、66億ドルを調達-企業価値1570億ドルと評価 https://www.bloomberg.co.jp/news/articles/2024-10-02/SKQLL4T1UM0W00 2024年
[bloomberg2] マスク氏のxAIが60億ドル調達-オープンAI対抗で研究開発加速へ https://www.bloomberg.co.jp/news/articles/2024-05-27/SE4Q9ET0G1KW00 2024年
[cryptopolitan] OpenAI、新たな資金調達で評価額1,500億ドルを目指す https://www.cryptopolitan.com/ja/openai%E3%81%AF%E8%A9%95%E4%BE%A1%E9%A1%8D1500%E5%84%84%E3%82%92%E7%9B%AE%E6%8C%87%E3%81%99/
[fragai] 【IQ120超!?】OpenAI o1の実力とは?GPT-4oとの比較から未来の可能性まで徹底解説 ( 2024年
[weel] Metaの新モデル「Llama 3.2」画像認識ができる最新LLMの実力とは!? https://weel.co.jp/media/tech/llama3-2/ 2024年