Agent57: Outperforming the Atari Human Benchmark
タイトル
『Agent57: Outperforming the Atari Human Benchmark』(ICML 2020)(URL:https://arxiv.org/abs/2003.13350)
著者
Adrià Puigdomènech Badia, Bilal Piot, Steven Kapturowski, Pablo Sprechmann, Alex Vitvitskyi, Daniel Guo, Charles Blundell
概要
57種類すべてのAtariゲームで人間のスコアを超えた"Agent 57"に関する論文
先行モデルであるR2D2によって57ゲーム中52ゲームのベースライン越えに成功しているが未だに超えられていないゲームには以下の様な特徴がある
- 報酬にディレイがあり長期間の行動が必要
- 行動空間が膨大であり探索が困難
これらに対処する為にNGU(Never give up)を用いる。
これによって探索方法を改善され、より良いモデルが出来る事が期待される。