いつも読んでいただきありがとうございます✨
今日は参考書籍を読んでも、イメージがつかみづらい・理解に
苦労する強化学習について参考となるサイトを紹介していきたいと思います。
目次
はじめに
なぜ動画を紹介するか?
勉強方法としてどのように活用するか?
新シラバス上の分類
説明動画紹介
他の動画の紹介
はじめに
なぜ動画を紹介するか?
・AIを専門的に学習したことがある人は別ですが、そうでない場合G検定で出てくる専門的な用語を理解するのはなかなか難しいと思います。(実際に私も最初勉強した時は理解が進まず苦労した記憶があります💧)
・一方でG検定では難解な数式を解きながらディープラーニングの手法を理解することは求められておりません。ビジネスにAIを活用するにあたって必要な知識を学習する事が求められています。
・そのためG検定で出てくる専門用語を図などを活用して視覚的に理解するのが最も効果的と考えています💡
・現在はYou tubeで様々な動画を見ることができ、その中で特に役に立つと思った動画を紹介していこうと思います💻
勉強方法としてどのように活用するか?
・G検定のテキスト・問題集を読み進める中で、どうしても理解が進まないと思った用語に絞って動画を見て理解を深める活用方法が非常に効果的です!
新シラバス上の分類
・本日紹介する強化学習は、テキストを読んでもなかなか理解が進まない
分野の1つです。
・新シラバスでは機械学習の概要のカテゴリに含まれております。
説明動画紹介
・強化学習は数回に分けて動画を紹介していきたいと思います。まずは基礎編の動画として2つの動画を紹介します!1つめはにゃごすけAI大学の動画です。
・この動画の良い点は①割引率の考え方である時間価値について丁寧に解説している点や②バンディットアルゴリズムのεグリーディ方策やUCB方策をラーメン屋の例でわかりやすく説明している点にあると思います。基礎を抑える点では前半中心に理解してもらえればと思います。
・逆に方策勾配法やアクタークリティックは用語だけまずはおさえていただければと思います。
2つ目のシミュレーションの世界に引きこもる部屋からの動画紹介です。こちらも基礎を理解するために活用ください。
・この動画の特に良い点は①マルコフ性をさいころを例に説明しておりわかりやすい点と②状態価値関数と行動価値関数を図を利用して説明しており、イメージしやすい点と③方策勾配法も大砲の発射角度と火薬の量のたとえで説明している点と④動画の最後で強化学習の大枠のカテゴリ分けを示してくれている点となります。
・逆にREINFORCEやA3Cの解説は詳細化されていないので、用語だけまずはおさえてください。
以上本日は強化学習の基礎編となります。次回も強化学習について解説している動画を引き続きご紹介いたします!