Gymで強化学習⑳Q学習と線形近似
前回は、連続値をとる状態の処理を関数近似によって行う方法について解説しました。今回はGymのカートポール(CartPole-v1)の環境を使ったQ学習の実装を線形近似を使って行います。
この記事が気に入ったらチップで応援してみませんか?
前回は、連続値をとる状態の処理を関数近似によって行う方法について解説しました。今回はGymのカートポール(CartPole-v1)の環境を使ったQ学習の実装を線形近似を使って行います。
この記事が気に入ったらチップで応援してみませんか?