ログイン
会員登録
Grokking
書いてみる
関連タグ
#LLM (7,435)
#大規模言語モデル (2,836)
#学習 (32,155)
#EmergentAbility (1)
#o3mini (152)
#エージェント (5,314)
人気
急上昇
新着
定番
有料のみ
4件
人気の記事一覧
【論文瞬読】深層学習モデルの『遅効学習』の謎に迫る - Grokkingの新たな発見
AI Nest
6か月前
17
松尾研サマースクール2023「大規模言語モデル講座」のコンテンツが無償公開されました!
Mさん
1年前
2
実験ノート:o3-miniの試行(2):層(sheaf)の概念とマルチエージェントの理論の整理、複数LLMで比較、DeepSeek-R1(US)は「Grokkingを層構造の相転移として定式化」、o1は「創発的な知能現象」の展望を開陳、DSR1本家は「新しい幾何学」を展望
ミトKeY(MeatKey)
6日前
Iteration Head: A Mechanistic Study of Chain-of-Thought
Ikemen Mas Kot
8か月前