見出し画像

SIRENを題材に機械学習の分類を考えてみる

タイトル:https://www.atpress.ne.jp/releases/167633/LL_img_167633_1.jpg?format=webp

SIRENをやったことがありますか?物凄く難しいゲームで、クリアするには100回以上はやり直す必要があるという大変楽しいモノです。
こんな感じ👇ですね。こんなシーンがずっと続きます。

https://corocoro.jp/wp-content/uploads/2020/08/cab34bed8b039e7457dbda869e60225a.png

攻略の方法にはこんなパターンがあります。

①攻略本を読まないで、自分の失敗から学んでいく。
②攻略本を読んで、最短ルートでクリアしていく。
③攻略本を読んで、自分なりに別の方法でクリアしていく。
④全くの偶然に任せて、失敗から何も学ばないでクリアしていく。
⑤まず簡単なSIREN2のイージーモードから初めて、初代SIRENに挑む。
※初代SIRENにはイージーモードがありません

私は③。攻略本の方法はあまりに難易度が高くて再現できないんだもの。攻略本さえもSIREN並にハードキルでした。


①攻略本を読まないで、自分の失敗から学んでいく。

👉これは強化学習(モデルフリー)です。ルールも何も分からないのに試行錯誤の中から学んでいきます。


②攻略本を読んで、最短ルートでクリアしていく。

👉これは数理最適化です。ルールが事前に分かっていることが必要です。強化学習ではプランニングと言います。


③攻略本を読んで、自分なりに別の方法でクリアしていく。

👉これは強化学習モデルフリープランニングの併用です。


④全くの偶然に任せて、失敗から何も学ばないでクリアしていく。

👉これはモンテカルロ法です。乱数で正解が出るまで繰り返すのみ。


⑤まず簡単なSIREN2のイージーモードから初めて、初代SIRENに挑む。

👉これは転移学習です。別のモノで学習して、それを転用する。




この記事が気に入ったらサポートをしてみませんか?