高校数学における「情報II」のためのデータサイエンス・データ解析入門 第1章 #6
株式会社リュディアです。引き続き総務省より公開されている高校数学における「情報II」のためのデータサイエンス・データ解析入門 第1章 についてまとめてみます。
総務省の元資料はこちらから参考にしてください。
また私どもリュディアがまとめている前回までの 高校数学における「情報II」のためのデータサイエンス・データ解析入門 第1章 に関するまとめ へのリンクは以下を参考にしてください。
今回は機械学習の大きな分類です。機械学習は大きく以下の 3 つに分類されます。
教師あり学習
教師なし学習
強化学習
3つの違いを簡単に説明していきます。何らかの機械学習で実装された人口知能全体をAIシステムと呼ぶことにします。
教師あり学習からいきます。学習するためのデータがあります。このデータは入力データに対して正解となる出力データも含みます。この入力と出力の組が教師データと呼ばれます。出力 = 結果も与えられるので教師と考え教師の真似をしてAIシステムが学習するイメージです。学習が終わったAIシステムに入力データを与え、予測出力を得るわけです。
次に教師なし学習です。名前のとおり学習データに正解となる出力データが与えらえていません。では何を学習するのか?入力データの中から特徴が似ているかどうか等をAIシステム自体が判断するわけです。例えばたくさんのメールの中から多数のメールが送られてくる送信元トップ5つをリストアップするといったことは教師なし学習です。
最後に強化学習です。学習データ自体に正解 = 教師は無いのですが別途設定された報酬を最大化するための行動を学習するものです。よく使われる例が自動歩行できるロボットです。もしこのロボットに教師あり学習で学習させるには、歩くための関節の角度、踏み出す距離などを教師データとして与える必要があります。これは分量的にも難しいです。しかし可動部の情報やどの範囲で可動可能かという情報をデータとして与え、あとは「バランスを崩さない」といったことを表現する関数を定義し、この関数が最大化されるように可動部の動作を自分自身に考えさせるというものです。
実際には教師あり学習、教師なし学習、強化学習のそれぞれを実現するためにさまざまな方式、アルゴリズムがあります。深層学習もその中の 1 つと考えればよいです。これらについてはまた別途まとめていきます。
では、ごきげんよう。