ログイン
会員登録
報酬関数
書いてみる
関連タグ
#モデル (14,797)
#学習 (29,636)
#強化学習 (744)
#2D構造 (1)
#AutoML (96)
#B3LYP (1)
人気
急上昇
新着
定番
有料のみ
7件
人気の記事一覧
ロボットをシミュレーション上で歩かせるには
Kawamura Akihiro
3か月前
1
Toward Self-Improvement of LLMs via Imagination, Searching, and Criticizing
Ikemen Mas Kot
7か月前
1
Deep reinforcement learning from human preferences
Ikemen Mas Kot
6か月前
Preference Fine-Tuning of LLMs Should Leverage Suboptimal, On-Policy Data
Ikemen Mas Kot
7か月前
RLIF: Interactive Imitation Learning as Reinforcement Learning
Ikemen Mas Kot
7か月前
Large Language Models Open New Way of AI-Assisted Molecule Design for Chemists
Ikemen Mas Kot
7か月前
From r to Q∗: Your Language Model is Secretly a Q-Function
Ikemen Mas Kot
7か月前