
ブロスタのAIを強化学習で作る
こんにちは。しげまつです。
強化学習に興味があり、スマブラで強化学習をやっている人を見つけ、僕なりの強化学習をやってみたいと思ったのでスマホゲームの「ブロスタ」というゲームで強化学習やってみようと思います。期間は絞らずのんびりやれればいいかなと思います。
画像をもとに報酬設定だったりいろいろやらないといけなくて結構難しそうなのでできないと思ったらしれっとやめるかも。
ちなみにしげまつはposデータ解析は得意ですが、画像・自然言語・強化学習をちょこっとかじったくらいなので結構詰まる予定。
ブロスタとは
すっっっっごい簡単にまとめると3vs3の数分で終わるゲームです。
詳しいのは下のURLをどうぞ
しげまつブロスタやったことあんの?
しげまつは2年前くらいに「ポコ」というキャラクターで最高日本53位にいました。現在もちょこちょこやっていますが、人口増えすぎて頑張っても日本順位3桁しか無理です。今は「ジャッキー」ってやつが好きです。
どんなAI作るの?
遠距離の敵に攻撃を100%で当てれるようなのを作りたかったのですが、PCでブロスタを動かしてキーボード入力でエイムするのがとても難しそうなので、近距離キャラでオートエイムで倒せるようなものを作ろうと思います。
「ジャッキー」「ブル」辺り使うかもしれません。
出力は主に移動と攻撃ボタンとそれらの組み合わせと思ってくれればいいです。
ゴールは敵を倒せるようになるまで。
環境
anaconda
GPU:GeForce RTX 3060
ブロスタ動かすもの:LDMultiPlayer
pytorch使う予定
環境ってこんな感じでいいかな?わかんない笑
下みたいな感じでやります。

学習環境
ステージ全部使うと時間がかかりすぎるので囲まれた状態で学習させます。

今後やることとか
OpenAIの環境だったら状態に対しての報酬が返ってくるのですが、それがないのでとりあえずリザルト画面から報酬与えられるようにしてみようかなと思います。
そのあとに学習するためのコード書いて回してみるという感じです。
終わりに
結構難易度の高いことをやっていると思うのでやれるだけやってみます。
長い航海になると思うのでのんびりやります~~