MeanSquaredError【平均二乗誤差】

・MeanSquaredErrorは平均二乗誤差(MSE)という
・実際の値と予測値の絶対値の2乗を平均したもの。
・MAEに比べて大きな誤差が存在する時に大きな値を示す。

sklearn.metrics.mean_squared_error

  ・第1引数:正解ラベル
  ・第2引数:予測ラベル

<手順①>ライブラリのインポート、データのロード

# ライブラリのインポート
import pandas as pd
import numpy as np
from sklearn.metrics import mean_squared_error
from sklearn.datasets import load_boston
from sklearn.neighbors import KNeighborsRegressor
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error

# データのロード
boston = load_boston()
df_boston = pd.DataFrame(data=boston.data,columns=boston.feature_names)
df_boston['target'] = boston.target

<手順②>インスタンス作成

# インスタンス作成
clf = KNeighborsRegressor()

<手順③>変数の設定、データの分割

# 説明変数
X = df_boston[boston.feature_names].values

# 目的変数target
Y = df_boston['target'].values

# データの分割
X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size = 0.2,random_state=0)

<手順➃>予測モデルの作成

# 予測モデルを作成
clf.fit(X_train, y_train)

<手順⑤>MSEの算出

# MSE算出
print(mean_squared_error(y_test, clf.predict(X_test)))

<手順⑥>RMSEの算出

# RMSE算出
print(np.sqrt(mean_squared_error(y_test, clf.predict(X_test))))




いいなと思ったら応援しよう!