Dueling Network Architectures for Deep Reinforcement Learning
タイトル
『Dueling Network Architectures for Deep Reinforcement Learning』
(ICML 2016) (URL:http://proceedings.mlr.press/v48/wangf16.html)
著者
Ziyu Wang, Tom Schaul, Matteo Hessel, Hado Hasselt, Marc Lanctot, Nando Freitas
概要
CNN, LSTM, AEなどの従来のニューラルネットではなく当たらなDueling Networkというモデルを紹介する。
これはstate value function と action advantage function の二つの異なる推定器を用意した手法であり、これによりアクションの学習を強化学習アルゴリズムを変更する事なく一般化する事が出来る。