Stage2 機械学習

2021年11月6日 22:46

機械学習の基本的な手法を学習する。

1-1. 線形回帰

ある入力（説明変数/特徴量）から出力（目的変数）を予測する教師あり学習のモデルの一つ。線形関数であらわされるものは線形回帰、非線形関数であらわされるものは非線形回帰と言う。各係数は、全てのデータに対する予測値と、実際の値の差分を最小にする、最小二乗法で導出する。

＜実装演習＞

sklearnに含まれる初学者の学習用データセットとして有名なボストンハウジングデータを使った住宅価格の予測を試してみる。sklearnを使用すると簡単に実装できる。

線形回帰モデルとアプローチは変わらない。代表的なものとして多項式関数、ガウス型既定関数がある。複雑な関数にしすぎると過学習が発生しやすいため、表現力を抑止する必要がある。

＜実装演習＞

分類を行うモデル。シグモイド関数を用いて目的変数を0か1で出力する。

＜実装演習＞

タイタニックの乗客データから生死を判別する実装を行う。

次元圧縮の手法。情報損失が少なくなるように圧縮する。

＜実装演習＞

乳がん検査データを用いて次元削減を行う。

・k近傍法

与えられたデータの最も近い点をk個取り、そのうち最も多く所属クラスに分類する教師あり学習の一つ。

・k-means

クラスタリング手法の一つ。教師なし学習。

＜実装演習＞

教師あり学習の二値分類モデル。データを分類する境界を見つける。境界は、最も近い点との距離が最大となる線を採用し、決定境界と呼ぶ。この際の最も近い点との距離をマージンと呼ぶ。

＜実装演習＞

まずは線形分離可能な場合は以下の通り。

この記事が気に入ったらサポートをしてみませんか？