
エクセル分析スペシャリスト対策 #02 - データ分散・2変量データの分析
「エクセル分析スペシャリスト」の学習、第二段。
今回はデータの分散・2変量データの分析について学習しました。
データの分散を比較する
単位の異なるデータの散らばり度合いを比較するには、分散と標準偏差の様な統計量を使います。また、変動係数も有効な指標です。標準偏差を平均で割ることで無次元数となるため、散らばり度合いを比較できるようになります。データの分布を比較するには、元の値を標準化・偏差値化するのも有効です。

2変量データの分析
データ分析をする際は、2つ以上の変数を組み合わせることがあります。
「改善するべき点は何か」「顧客にはどのような傾向があるか」といった課題がある場合、変数同士の関係性を明らかにすれば手がかりが得られます。
2変数の間に原因・結果が存在する場合、因果関係にあると言います。
因果関係には質的変数・量的変数の関係の組み合わせ次第で4つのパターンがあります。こうした因果関係は表やグラフにする・統計量を算出する等の手法で分析することができます。
質的変数・質的変数の関係を分析するには、組み合わせの表と度数を表すクロス集計表を作ります。

質的変数・量的変数の関係を分析するには、カテゴリーごとの統計量を算出して棒グラフ等の度数分布表にします。

量的変数・量的変数の関係を分析するには、散布図を使います。因果関係を想定している場合は、横軸に原因系・縦軸に結果系を採用するのが一般的です。
量的変数同士の関係は、相関係数で表すこともできます。
相関係数は相関関係の強さを表しますが、直接的な因果関係を表す指標ではありません。

量的変数・質的変数の関係を分析するには、カテゴリーを縦軸に取った散布図を利用します。有意な変化があるかは、近似直線として直線関係を図示することができます。

次回はクロス集計表とカイ2乗分布について学習します。私が超苦手な奴です。(笑)お楽しみに!