記事一覧
Never Give Up: Learning Directed Exploration Strategies
タイトル 『Never Give Up: Learning Directed Exploration Strategies』(ICLR 2020) (URL: https://openreview.net/forum?id=Sye57xStvB) 著者 『Adrià Puigdomènech B…
Portfolio Management using Reinforcement Learning
タイトル 『Portfolio Management using Reinforcement Learning』(2016) (URL:http://cs229.stanford.edu/proj2016/report/JinElSaawy-PortfolioManagementusingReinforce…
Stabilizing Transformers for Reinforcement Learning Emilio
タイトル 『Stabilizing Transformers for Reinforcement Learning Emilio』(ICML 2020) (URL:https://arxiv.org/abs/1910.06764) 著者 Emilio Parisotto, H. Francis S…
Agent57: Outperforming the Atari Human Benchmark
タイトル 『Agent57: Outperforming the Atari Human Benchmark』(ICML 2020)(URL:https://arxiv.org/abs/2003.13350) 著者 Adrià Puigdomènech Badia, Bilal Piot, Ste…
RECURRENT EXPERIENCE REPLAY IN DISTRIBUTED REINFORCEMENT LEARNING
タイトル 『RECURRENT EXPERIENCE REPLAY IN DISTRIBUTED REINFORCEMENT LEARNING』(ICLR 2019)(URL:https://openreview.net/forum?id=r1lyTjAqYX) 著者 Steven Kapturo…
DISTRIBUTED PRIORITIZED EXPERIENCE REPLAY
タイトル 『DISTRIBUTED PRIORITIZED EXPERIENCE REPLAY』(ICLR 2018) (URL: https://openreview.net/forum?id=H1Dy---0Z) 著者 Dan Horgan, John Quan, David Budden, Ga…
Massively Parallel Methods for Deep Reinforcement Learning
タイトル 『Massively Parallel Methods for Deep Reinforcement Learning』(ICML 2015) (URL:https://arxiv.org/abs/1507.04296) 著者 Arun Nair, Praveen Srinivasan,…
Rainbow: Combining Improvements in Deep Reinforcement Learning
タイトル 『Rainbow: Combining Improvements in Deep Reinforcement Learning』 (AAAI2018) (URL:https://arxiv.org/abs/1710.02298) 著者 Matteo Hessel, Joseph Moday…
Dueling Network Architectures for Deep Reinforcement Learning
タイトル 『Dueling Network Architectures for Deep Reinforcement Learning』 (ICML 2016) (URL:http://proceedings.mlr.press/v48/wangf16.html) 著者 Ziyu Wang, Tom …
PRIORITIZED EXPERIENCE REPLAY
タイトル 『PRIORITIZED EXPERIENCE REPLAY』(ICRL 2016) (URL: https://arxiv.org/abs/1511.05952) 著者 Tom Schaul, John Quan, Ioannis Antonoglou, David Silver 概…
Deep Reinforcement Learning with Double Q-learning
タイトル 『Deep Reinforcement Learning with Double Q-learning』(AAAI 2016) (URL:https://arxiv.org/abs/1509.06461) 著者 Hado van Hasselt, Arthur Guez, David Sil…
Cryptocurrency Portfolio Management with Deep Reinforcement Learning
タイトル
『Cryptocurrency Portfolio Management with Deep Reinforcement Learning』(IntelliSys 2017)
著者
Zhengyao Jiang, Jinjun Liang
概要
強化学習を用いた仮想通貨におけるポートフォリオ最適化の論文。
本論文では方策勾配法のアルゴリズムを用いている(ポートフォリオ最適化の場合アク
Never Give Up: Learning Directed Exploration Strategies
タイトル
『Never Give Up: Learning Directed Exploration Strategies』(ICLR 2020)
(URL: https://openreview.net/forum?id=Sye57xStvB)
著者
『Adrià Puigdomènech Badia, Pablo Sprechmann, Alex Vitvitskyi, Daniel Guo
Portfolio Management using Reinforcement Learning
タイトル
『Portfolio Management using Reinforcement Learning』(2016)
(URL:http://cs229.stanford.edu/proj2016/report/JinElSaawy-PortfolioManagementusingReinforcementLearning-report.pdf)
著者
O Jin, H El-Saawy
Stabilizing Transformers for Reinforcement Learning Emilio
タイトル
『Stabilizing Transformers for Reinforcement Learning Emilio』(ICML 2020)
(URL:https://arxiv.org/abs/1910.06764)
著者
Emilio Parisotto, H. Francis Song, Jack W. Rae, Razvan Pascanu, Caglar Gulcehre
Agent57: Outperforming the Atari Human Benchmark
タイトル
『Agent57: Outperforming the Atari Human Benchmark』(ICML 2020)(URL:https://arxiv.org/abs/2003.13350)
著者
Adrià Puigdomènech Badia, Bilal Piot, Steven Kapturowski, Pablo Sprechmann, Alex Vitvitskyi
RECURRENT EXPERIENCE REPLAY IN DISTRIBUTED REINFORCEMENT LEARNING
タイトル
『RECURRENT EXPERIENCE REPLAY IN DISTRIBUTED REINFORCEMENT LEARNING』(ICLR 2019)(URL:https://openreview.net/forum?id=r1lyTjAqYX)
著者
Steven Kapturowski, Georg Ostrovski, John Quan, R´emi Munos, Wi
Deep Direct Reinforcement Learning for Financial Signal Representation and Trading
タイトル
『Deep Direct Reinforcement Learning for Financial Signal Representation and Trading』
(IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, VOL. 28, NO. 3, MARCH 2017)(論文元)
著者
Yue Deng, Fen
DISTRIBUTED PRIORITIZED EXPERIENCE REPLAY
タイトル
『DISTRIBUTED PRIORITIZED EXPERIENCE REPLAY』(ICLR 2018)
(URL: https://openreview.net/forum?id=H1Dy---0Z)
著者
Dan Horgan, John Quan, David Budden, Gabriel Barth-Maron, Matteo Hessel, Hado van Hasse
Massively Parallel Methods for Deep Reinforcement Learning
タイトル
『Massively Parallel Methods for Deep Reinforcement Learning』(ICML 2015)
(URL:https://arxiv.org/abs/1507.04296)
著者
Arun Nair, Praveen Srinivasan, Sam Blackwell, Cagdas Alcicek, Rory Fearon, Ales
Rainbow: Combining Improvements in Deep Reinforcement Learning
タイトル
『Rainbow: Combining Improvements in Deep Reinforcement Learning』
(AAAI2018) (URL:https://arxiv.org/abs/1710.02298)
著者
Matteo Hessel, Joseph Modayil, Hado van Hasselt, Tom Schaul, Georg Ostrovski
Dueling Network Architectures for Deep Reinforcement Learning
タイトル
『Dueling Network Architectures for Deep Reinforcement Learning』
(ICML 2016) (URL:http://proceedings.mlr.press/v48/wangf16.html)
著者
Ziyu Wang, Tom Schaul, Matteo Hessel, Hado Hasselt, Marc Lancto
Computational Learning Techniques for Intraday FX Trading Using Popular Technical Indicators
タイトル
『Computational Learning Techniques for Intraday FX Trading Using Popular Technical Indicators』(IEEE TRANSACTIONS ON NEURAL NETWORKS, VOL. 12, NO. 4, JULY 2001)
(URL:https://ieeexplore.ieee.org/ab
PRIORITIZED EXPERIENCE REPLAY
タイトル
『PRIORITIZED EXPERIENCE REPLAY』(ICRL 2016)
(URL: https://arxiv.org/abs/1511.05952)
著者
Tom Schaul, John Quan, Ioannis Antonoglou, David Silver
概要
従来の経験再生はリプレイメモリからランダムにサンプリングしてくるだけだったが、サンプリングの仕方
Deep Reinforcement Learning with Double Q-learning
タイトル
『Deep Reinforcement Learning with Double Q-learning』(AAAI 2016)
(URL:https://arxiv.org/abs/1509.06461)
著者
Hado van Hasselt, Arthur Guez, David Silver
概要
DQNとDouble Q-learningを組み合わせた"Double DQN"