ログイン
会員登録
サブオプティマリティギャップ
書いてみる
関連タグ
#Dagger (9)
#RLIF (1)
#サンプル複雑性 (2)
#タスク (7,052)
#介入 (958)
#報酬関数 (7)
人気
急上昇
新着
定番
有料のみ
1件
人気の記事一覧
RLIF: Interactive Imitation Learning as Reinforcement Learning
Ikemen Mas Kot
5か月前