Rainbow: Combining Improvements in Deep Reinforcement Learning
タイトル
『Rainbow: Combining Improvements in Deep Reinforcement Learning』
(AAAI2018) (URL:https://arxiv.org/abs/1710.02298)
著者
Matteo Hessel, Joseph Modayil, Hado van Hasselt, Tom Schaul, Georg Ostrovski, Will Dabney, Dan Horgan, Bilal Piot, Mohammad Azar, David Silver
概要
これまでに出てきた深層強化学習モデルを組み合わせた『Rainbow』モデルによる性能評価と既存モデルの影響力を示した論文。
フルモデルRainbowから一つの手法を除去したモデルでの性能差を検討する事でモデルの有用性を測っている。
Rainbowに使われた手法は
-DQN
-Double DQN
-Prioritized experience replay
-Dueling network
-A3C
-Distributional Q-learning
-Noisy DQN