Excel分析対策 #02 第5-6章
エクセル分析スペシャリストを勉強していて引っかかったこと・実務でデータ解析などをする際に気を付けるべき事を復習し始めることにしました。
1、クロス集計表とカイ2乗検定・残差分析
クロス集計表のカイ2乗検定をする際の注意点は度数を少なくとも5以上にする事です。度数が1~5など、小さい値だと正確な検定ができません。
カイ2乗検定を 観測度数・期待度数のクロス集計表から行うには、
CHISQ.TEST()関数を使います。
残差分析を行うには、まず観測度数の調整済み標準化残差を求めます。
標準化残差は、(観測度数ー期待度数)/√(期待度数)という値で求められます。調整済み残差というのは、標準化残差とその分散を用いて標準化した値です。調整済み残差の分布は平均0、標準偏差1の標準正規分布に従うことが分かっています。
個々のセルの有意確率は、標準正規分布の累積確率を求める 2*(1-NORM.S.DIST(ABS(), TRUE)) という関数で求めることができます。期待度数と比較した残差に有意差があるかは、調整済み標準化残差の値が有意確率以下の値であるかで検定することができます。
2、平均値のt検定・等分散性のF検定・一元配置分散分析
データが標本データである場合は、質的変数に対する量的変数の平均に有意差があるかはt検定で検定することができます。一方、分散の値に有意差があるかはF検定を使って検定します。
平均値の検定には3つのケースがあり、Excelではデータ→データ分析から以下の手法を選べます。
また、2標本が等分散か・等分散でないかはデータ→データ分析からF検定を行うことで検定することができます。2標本の平均の検定を行いたい場合は、まずF検定で等分散か否かを算出してください。またExcelのF検定は片側検定なので、p値を2倍して両側検定の値に直す必要があります。
また、Excelでは一元配置分散分析という、3標本以上の平均の検定ができます。