ブロスタのAIを強化学習で作る④
こんにちは。しげまつです。
ブロスタAIの進捗状況を書こうと思います。
一応現在の状況を書くとAIの学習段階に来ています。
動画載せたいですがnoteの中に入れれないんですね。
学習を試みたのですが、エミュレーターが重いせいなのか100戦くらい学習したらほぼ確実に行動を起こしても環境に反映されないようになってしまいます。
現在までにやったこと
gpuを使えるようにする
学習するためのコードを書く
この二つです。
gpuを使えるようにする
このURLを見ながらやりました。
最初うまくいかなかったので一度pytorchをアンインストールしてURL通りにやったらいけました。
https://frqux.hatenablog.com/entry/2023/02/07/062433
学習するためのコードを書く
pytorchチュートリアルの強化学習のコードをいじいじしながら作ってます。
https://yutaroogawa.github.io/pytorch_tutorials_jp/
今後の課題
最初に書きましたが、エミュレーターが重いせいか行動を起こしても環境に反応がないです。しかし、ボタン入力で移動ができないのですが、マウスでクリックしていきたい方向に移動させれば反応したので、移動する方法をキー入力からマウスで行うようにしてみようかと思ってます。
100戦くらい学習してみて思ったのが学習している「ブル」というキャラクターは敵が近くにいると高い攻撃力を持つので敵が一定距離に入ってきたら報酬を与えてダメージ受けたら罰を与えるような方法がいいのかもしれません。
現状の勝ったら報酬+1負けたら報酬ー1だと攻撃を負ける間際に攻撃を与えていても攻撃という行動がマイナスになってしまうような気がするので、報酬を増やす方向でやっていこうと思います。
書き忘れてましたがエミュレーターをblue stack5に変えました。気持ち前のエミュレーターより軽くなった気がします。
ではまた。
この記事が気に入ったらサポートをしてみませんか?