前回は、Dueling DQNの実装を行いました。今回は、DQNに対するもう一つの改善策である優先度付き経験再生について解説します。
優先度付き経験再生はDQN、Double DQN、Dueling DQNに適用できる手法です。Dueling DQNではそもそも優先度付き経験再生を使うことを前提にして論文が書かれています。
優先度付き経験再生を使う目的は、訓練用に集めた経験のデータに優先度をつけて学習を効率的に進めてことです。DeepMindが2015年に発表した論文で紹介されています。
今回は、この優先度付き経験再生の仕組みについて解説します。
では、さっそく始めましょう。