[実行用プログラム公開] コピペだけで回帰分析に不要な説明変数(記述子・特徴量・入力変数)を簡単な方法で削除して変数選択する (Python言語)
こんにちは!大学教員ブロガーのねこしです。http://univprof.com/
仕事や研究において、説明変数(記述子・特徴量・入力変数)を手軽に選択したい方もいらっしゃると思います。この適切かつ簡単に変数選択する実用的かつ実践的な方法はこちらに書きました。
http://univprof.com/archives/16-11-22-8587099.html
しかし、変数選択のやり方はわかっても、実際に変数選択を実行できるとは限りません。プログラミングするには、いくつものページを調べながら進める必要があり一手間かかります。
そこでコピペするだけで回帰分析に不要な説明変数を簡単な方法で削除して変数選択プログラムを作りました。
データ形式・必要なソフトウェア
以下の記事に示す形式のデータ(data.csv)さえ準備すれば、Python言語で変数選択が可能です。
https://note.mu/univprof/n/n694487325cb1
Python言語のために必要なソフトウェアは以下の記事をご覧ください。
https://note.mu/univprof/n/nb07629b23252
実行結果
実行結果を下に示します。削除された説明変数名・変数番号が”DeletedXvariable.csv”に保存されます。繰り返し計算の過程で上から順に削除されたことを表します。同じくプログラムを実行すると出力される、残った説明変数の数とダブルクロスバリデーション後のRMSEとのプロットを見て、適切な変数の数になるように上から順に削除してください。たとえば、ぜんぶで10変数あり、プロットから6変数が望ましいと判断されたときは、選択された最初の4変数を削除することになります。
このプログラムからスタートしてさらにプログラミングを進めたいと考えている方にもぜひ利用していただければと思います。
プログラム公開
ここまでお読みいただきありがとうございます。
Python言語のプログラムは有料コンテンツとします。ただこれにより、こちらに記載した簡便な変数選択をすぐに実行できます。
http://univprof.com/archives/16-11-22-8587099.html
こちらからプログラムのzipファイル自体はダウンロードできます。
http://univprofblog.html.xdomain.jp/code/plsbitr_analysis_all_e_python_pass.zip
購入していただくと解凍のためのパスワードがありますのでそちらをご利用ください。
またこちらのzipファイルに必要なスクリプトと関数があります。パスワードはかけていません。購入後に使い方の説明があります。
http://univprofblog.html.xdomain.jp/code/supportingfunctions.zip
ここから先は
¥ 980
Amazonギフトカード5,000円分が当たる
この記事が気に入ったらチップで応援してみませんか?