見出し画像

[実行用プログラム公開] コピペだけで回帰分析に不要な説明変数(記述子・特徴量・入力変数)を簡単な方法で削除して変数選択する (Python言語)

こんにちは!大学教員ブロガーのねこしです。http://univprof.com/

仕事や研究において、説明変数(記述子・特徴量・入力変数)を手軽に選択したい方もいらっしゃると思います。この適切かつ簡単に変数選択する実用的かつ実践的な方法はこちらに書きました。

http://univprof.com/archives/16-11-22-8587099.html

しかし、変数選択のやり方はわかっても、実際に変数選択を実行できるとは限りません。プログラミングするには、いくつものページを調べながら進める必要があり一手間かかります。

そこでコピペするだけで回帰分析に不要な説明変数を簡単な方法で削除して変数選択プログラムを作りました。

データ形式・必要なソフトウェア

以下の記事に示す形式のデータ(data.csv)さえ準備すれば、Python言語で変数選択が可能です。

https://note.mu/univprof/n/n694487325cb1

Python言語のために必要なソフトウェアは以下の記事をご覧ください。

https://note.mu/univprof/n/nb07629b23252

実行結果

実行結果を下に示します。削除された説明変数名・変数番号が”DeletedXvariable.csv”に保存されます。繰り返し計算の過程で上から順に削除されたことを表します。同じくプログラムを実行すると出力される、残った説明変数の数とダブルクロスバリデーション後のRMSEとのプロットを見て、適切な変数の数になるように上から順に削除してください。たとえば、ぜんぶで10変数あり、プロットから6変数が望ましいと判断されたときは、選択された最初の4変数を削除することになります。

このプログラムからスタートしてさらにプログラミングを進めたいと考えている方にもぜひ利用していただければと思います。

プログラム公開

ここまでお読みいただきありがとうございます。

Python言語のプログラムは有料コンテンツとします。ただこれにより、こちらに記載した簡便な変数選択をすぐに実行できます。

http://univprof.com/archives/16-11-22-8587099.html

こちらからプログラムのzipファイル自体はダウンロードできます。

http://univprofblog.html.xdomain.jp/code/plsbitr_analysis_all_e_python_pass.zip

購入していただくと解凍のためのパスワードがありますのでそちらをご利用ください。

またこちらのzipファイルに必要なスクリプトと関数があります。パスワードはかけていません。購入後に使い方の説明があります。

http://univprofblog.html.xdomain.jp/code/supportingfunctions.zip

ここから先は

410字

¥ 980

期間限定!Amazon Payで支払うと抽選で
Amazonギフトカード5,000円分が当たる

この記事が気に入ったらチップで応援してみませんか?