ログイン
会員登録
非専門家フィードバック
書いてみる
関連タグ
#エージェント (4,009)
#ディープニューラルネットワーク (3)
#フィードバック (6,289)
#人間 (70,941)
#人間の好み (2)
#報酬関数 (7)
#報酬関数学習 (1)
人気
急上昇
新着
定番
有料のみ
1件
人気の記事一覧
Deep reinforcement learning from human preferences
Ikemen Mas Kot
4か月前