scikit-learnで単回帰分析する際の注意
単回帰分析のみ、説明変数のデータは2次元配列にする必要がある
jupyter notebookにて
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
from sklearn.linear_model import LinearRegression as LR
#学習データ
train = pd.read_csv("train.csv")
#評価データ
test = pd.read_csv("test.csv")
# 学習データの説明変数、目的変数
trainX = train["temperature"]
y = train["y"]
# 評価データの説明変数
testX = test["temperature"]
# 単回帰分析のみ、説明変数のデータの形を整える必要あり
# 1次元配列→2次元配列への変換(例:[1, 2, 3] -> [ [1], [2], [3] ])
trainX = trainX.values.reshape(-1, 1)
testX = testX.values.reshape(-1, 1)