非専門家フィードバック

書いてみる

関連タグ

#エージェント (5,327)

#ディープニューラルネットワーク (3)

#フィードバック (7,491)

#人間 (79,734)

#人間の好み (2)

#報酬関数 (8)

#報酬関数学習 (1)

有料のみ

1件

人気の記事一覧

Deep reinforcement learning from human preferences

8か月前

noteプレミアム
note pro
よくある質問・noteの使い方
プライバシー
フィードバック
ご利用規約
通常ポイント利用特約
加盟店規約
資⾦決済法に基づく表⽰
特商法表記