見出し画像

Gymで強化学習⑯TD学習法:理論編

前回はモンテカルロ法の実装を行いました。この強化学習のシリーズではこれまで動的計画法モンテカルロ法の理論と実装を行ってきましたが、この両方の知識を組み合わせたものがTD学習法となります。


ここから先は

5,909字 / 2画像

キカベン・読み放題

¥1,000 / 月
初月無料
このメンバーシップの詳細

この記事が気に入ったらサポートをしてみませんか?