見出し画像

Gymで強化学習

澁谷直樹 @ キカベン

2025年1月24日 17:35

Gymで強化学習シリーズの記事リストです。

強化学習の基本

表形式の強化学習

動的計画法

モンテカルロ法

TD学習からQ学習

表形式からネットワークへ

Deep Q-Network

DQN

Double DQN

Dueling DQN

優先度付き経験再生

Atariゲームへの応用

ポリシーベースのアプローチ

REINFORCE

Actor-Critic

TRPOとPPO

モデルベースの強化学習

㊿モデルフリーとモデルベース

いいなと思ったら応援しよう！