ログイン
会員登録
自己注意
書いてみる
関連タグ
#モデル (16,362)
#ChatGPT (104,720)
#TSE率 (1)
#transformer (360)
#わたしの勉強法 (6,697)
#アルゴリズム (3,879)
人気
急上昇
新着
定番
有料のみ
4件
人気の記事一覧
ChatGPTの仕組み(いつものAttentionの論文)をメタファーと数式と図解と用語集であらわす
Yuki
3か月前
21
🦜トランスフォーマーモデルは順伝播逆伝播どちらにより新規性がありましたか?
あたり帳簿
1年前
1
Conv-Basis: A New Paradigm for Efficient Attention Inference and Gradient Computation in Transformers
Ikemen Mas Kot
8か月前
Why "classic" Transformers are shallow and how to make them go deep
Ikemen Mas Kot
9か月前