CartPoleをPytorchで実装する
強化学習を実装する際は、EnvironmentやAgentなどを別々のclassとして実装します。
これはclassに分けることによってそれぞれのclass毎でdebugすることができるようにすることが1つの理由だと聞きました。
しかし、実際にdebugする際にサンプルコードがないと困ります。
Pytorchによるサンプルコードがパッと見たところ見当たらなかったので、メモとしてここに示すことにします。(ほとんど自分のため)
扱う問題はOpenAI gymのCartPoleです