ログイン
会員登録
サマリゼーション
書いてみる
関連タグ
#GPT4 (8,456)
#KLダイバージェンス (11)
#L2正則化 (8)
#アダムオプティマイザー (2)
#アルゴリズム (3,327)
#ウォームアップ (212)
人気
急上昇
新着
定番
有料のみ
2件
人気の記事一覧
Direct Preference Optimization: Your Language Model is Secretly a Reward Model
Ikemen Mas Kot
5か月前
Better & Faster Large Language Models via Multi-token Prediction
Ikemen Mas Kot
6か月前