scikit-learnで単回帰分析する際の注意

単回帰分析のみ、説明変数のデータは2次元配列にする必要がある

jupyter notebookにて

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
from sklearn.linear_model import LinearRegression as LR

#学習データ
train = pd.read_csv("train.csv")

#評価データ
test = pd.read_csv("test.csv")

# 学習データの説明変数、目的変数
trainX = train["temperature"]
y = train["y"]

# 評価データの説明変数
testX = test["temperature"]

# 単回帰分析のみ、説明変数のデータの形を整える必要あり
# 1次元配列→2次元配列への変換(例:[1, 2, 3] -> [ [1], [2], [3] ])
trainX = trainX.values.reshape(-1, 1)
testX = testX.values.reshape(-1, 1)