ログイン
会員登録
報酬関数
書いてみる
関連タグ
#モデル (16,168)
#学習 (31,905)
#強化学習 (818)
#2D構造 (1)
#AI (341,524)
#AutoML (98)
人気
急上昇
新着
定番
有料のみ
8件
人気の記事一覧
報酬関数の罠とAIの賢さ:リワードハッキングの本質
Zun-Beho
1か月前
2
ロボットをシミュレーション上で歩かせるには
Kawamura Akihiro
5か月前
1
Toward Self-Improvement of LLMs via Imagination, Searching, and Criticizing
Ikemen Mas Kot
9か月前
1
Deep reinforcement learning from human preferences
Ikemen Mas Kot
8か月前
Preference Fine-Tuning of LLMs Should Leverage Suboptimal, On-Policy Data
Ikemen Mas Kot
9か月前
RLIF: Interactive Imitation Learning as Reinforcement Learning
Ikemen Mas Kot
9か月前
Large Language Models Open New Way of AI-Assisted Molecule Design for Chemists
Ikemen Mas Kot
9か月前
From r to Q∗: Your Language Model is Secretly a Q-Function
Ikemen Mas Kot
9か月前