
Photo by
akanemachi
機械学習自動化ツール 〜回帰編〜
前回の記事で機械学習自動化ツール〜分類編〜を扱いました。
そこで今回は〜回帰編〜です。
回帰というのは簡単に言ってしまえば数値の予測です(分類はカテゴリの予測でした)。
では今回の自動化ツールを使って回帰による予測をしていましょう。

前回と同様の学習データです。
全ての項目のデータが揃っています。

こちらが予測用のデータ。身長のデータだけありません。
ここから
性別、体重、年齢 → 身長
の予測を行なっていきます。
この2つのデータを機械学習自動化ツールにインプットしてみましょう。
結果がこちら。

なんとも言えない結果ですね。当たっているような当たっていないような。
ちなみに「男」に1.0と入っているデータは男で、「女」に1.0と入っているデータは女です。この辺はUIを改善した方が良さそうですね。
特徴量の影響度合いは、

意外なことに年齢が大きく影響していました(個人的には体重の影響が大きいのと持ってました)。
正解率は、

ほぼ6割のなので悪くはないですが、分類の時よりは劣ってますね。
最後に各アルゴリズムの比較結果です。

今回はサポートベクターマシンはふるわなかったようですね。
線形回帰に正則化項をを使いしたリッジ回帰が一番でした。
ラッソ回帰も正則化項を入れるという点では同じなのですがかなり引き離されています。
回帰に関してはまだ改善の余地があるかな、という状態です。
オリジナルのアルゴリズムを入れることなども検討していきたいと思います。