見出し画像

Gymで強化学習⑳Q学習と線形近似

前回は、連続値をとる状態の処理を関数近似によって行う方法について解説しました。今回はGymのカートポール(CartPole-v1)の環境を使ったQ学習の実装を線形近似を使って行います。

CartPole-v1

ここから先は

17,316字 / 1画像

キカベン・読み放題

¥1,000 / 月
初月無料
このメンバーシップの詳細

この記事が気に入ったらサポートをしてみませんか?