見出し画像

Gymで強化学習㉔月面着陸:DQN編

澁谷直樹 @ キカベン

2023年6月17日 10:53

前回、DQN（Deep Q-Network）を実装してカートポールの環境で実験しました。今回は、月面着陸の環境でDQNを実践します。

今回は、前回の実装に以下の改良を加えました。

Tensorboard（テンソルボード）の導入
訓練用とテスト用のエージェントの分離
いくつかの訓練設定のオプションを追加

また、後でDouble DQNやDueling DQNを実装しやすいように細かい変更を加えています。それについては次回以降に解説します。

この記事では、リファクタリングされたDQNのコードと実験結果を解説します。

では、さっそく始めましょう。

ここから先は

35,109字 / 7画像

キカベン・読み放題

¥1,000 / 月

アルゴリズム、機械学習、深層学習、強化学習、量子技術をわかりやすく

すべての記事とマガジンが読み放題
メンバー限定の会員証が発行されます
活動期間に応じたバッジを表示
メンバー限定掲示板を閲覧できます
メンバー特典記事を閲覧できます
メンバー特典マガジンを閲覧できます

このメンバーシップの詳細

この記事が気に入ったらチップで応援してみませんか？