ログイン
会員登録
最適方策
書いてみる
関連タグ
#Dagger (10)
#RLIF (1)
#サブオプティマリティギャップ (1)
#サンプル複雑性 (2)
#タスク (8,707)
#介入 (1,005)
#報酬関数 (8)
人気
急上昇
新着
定番
有料のみ
1件
人気の記事一覧
RLIF: Interactive Imitation Learning as Reinforcement Learning
Ikemen Mas Kot
9か月前