見出し画像

Gymで強化学習㉙優先度付き経験再生:理論編

前回は、Dueling DQNの実装を行いました。今回は、DQNに対するもう一つの改善策である優先度付き経験再生について解説します。

優先度付き経験再生はDQN、Double DQN、Dueling DQNに適用できる手法です。Dueling DQNではそもそも優先度付き経験再生を使うことを前提にして論文が書かれています。

優先度付き経験再生を使う目的は、訓練用に集めた経験のデータに優先度をつけて学習を効率的に進めてことです。DeepMindが2015年に発表した論文で紹介されています。

今回は、この優先度付き経験再生の仕組みについて解説します。

では、さっそく始めましょう。


ここから先は

7,895字

キカベン・読み放題

¥1,000 / 月
このメンバーシップの詳細

この記事が気に入ったらチップで応援してみませんか?