「マルチコ」について学んでみた
デジタルマーケティングを通して統計学を学んでいる方へ、私が重回帰分析を学んでいる時に知った「マルチコ」の紹介と対応をお伝えします。
きっかけ
重回帰分析を学んでて「説明変数の中に相関係数が高くてどちらの説明変数を使っていいか分からない状態がある」が「マルチコ」と知ったのが最初。
マルチコはどんな風に表れる?
マルチコは日本語で多重共線性と呼ばれてます。重回帰分析で使用する説明変数を相関分析して高い相関(0.9~1 か -0.9~-1)が現れたら注意します。
どちらの説明変数を削除?
上記の表からAとCは高い相関とわかります。でも、「AとCのどちらを削除するの?」は分かりません。そんな時はVIFを利用します。
マルチコを検出するの指標の1つVIF
VIF値から削除対象が見つかります。VIFの説明は下記の通りです。
VIF(Variance Inflation Factor:分散拡大要因)は独立変数間の多重共線性を検出するための指標の1つ。値が大きい場合はその変数を分析から除いた方がよいと考えてられる。10を基準とすることが多い。
VIFを使ってみる
エクセルの関数「MINVERSE」を使用します。右表で赤文字が評価値です。
VIF値10以上はC(15.98)。これで「説明変数Cを除外」と判断出来ます。
感謝
ここまで読んで頂き、ありがとうございます。重回帰分析する際の一助になれば幸いです。私も引き続き、統計学を学び続けていきます。一緒に頑張りましょう!