![見出し画像](https://assets.st-note.com/production/uploads/images/91391752/rectangle_large_type_2_b2f13022949ed97f51e93f686091644c.png?width=1200)
エクセル分析スペシャリスト対策 #02 - データ分散・2変量データの分析
「エクセル分析スペシャリスト」の学習、第二段。
今回はデータの分散・2変量データの分析について学習しました。
データの分散を比較する
単位の異なるデータの散らばり度合いを比較するには、分散と標準偏差の様な統計量を使います。また、変動係数も有効な指標です。標準偏差を平均で割ることで無次元数となるため、散らばり度合いを比較できるようになります。データの分布を比較するには、元の値を標準化・偏差値化するのも有効です。
![](https://assets.st-note.com/img/1668678217224-IGdy2Su9ND.png?width=1200)
2変量データの分析
データ分析をする際は、2つ以上の変数を組み合わせることがあります。
「改善するべき点は何か」「顧客にはどのような傾向があるか」といった課題がある場合、変数同士の関係性を明らかにすれば手がかりが得られます。
2変数の間に原因・結果が存在する場合、因果関係にあると言います。
因果関係には質的変数・量的変数の関係の組み合わせ次第で4つのパターンがあります。こうした因果関係は表やグラフにする・統計量を算出する等の手法で分析することができます。
質的変数・質的変数の関係を分析するには、組み合わせの表と度数を表すクロス集計表を作ります。
![](https://assets.st-note.com/img/1668678360232-goKOc4aTp9.png?width=1200)
質的変数・量的変数の関係を分析するには、カテゴリーごとの統計量を算出して棒グラフ等の度数分布表にします。
![](https://assets.st-note.com/img/1668678439566-PLekskpUT2.png?width=1200)
量的変数・量的変数の関係を分析するには、散布図を使います。因果関係を想定している場合は、横軸に原因系・縦軸に結果系を採用するのが一般的です。
量的変数同士の関係は、相関係数で表すこともできます。
相関係数は相関関係の強さを表しますが、直接的な因果関係を表す指標ではありません。
![](https://assets.st-note.com/img/1668678548689-nsOC368SgT.png?width=1200)
量的変数・質的変数の関係を分析するには、カテゴリーを縦軸に取った散布図を利用します。有意な変化があるかは、近似直線として直線関係を図示することができます。
![](https://assets.st-note.com/img/1668678579792-UEd6Q14eWO.png?width=1200)
次回はクロス集計表とカイ2乗分布について学習します。私が超苦手な奴です。(笑)お楽しみに!