【STATAコマンドメモ】検定方法の整理とコマンド
ランダム化比較実験の検証を行う前に、そもそもランダム化したグループが本当に系統的な違いがないかどうかをチェックする必要がある。(ランダム化チェック)
こうしたランダム化チェックでは、グループ間での検定を実施するが、この検定方法はデータの特性によって違いがある。
◆検定方法の違い
検定方法の違いについて整理した図は以下の通り。
※出展:stataによる医療系データ分析入門 p310
連続変数の定義については割愛。
◆カイ二乗検定について
STATAコマンドは以下の通り。
tabulate 変数1 変数2,chi
※したがって、トリートメント群とコントロール群による属性の系統的な違いを見たいときは、変数1を「トリートメントダミー」にし、変数2に「見たい変数を選択する。
なお、コマンドは
tabulate 変数1 変数2,row all
でもOK。
このうち、カイ二乗検定は、
Pearson chi2(1) の Pr = の値が該当。
ちなみにallのオプションは他の検定結果も表示してくれる。
likelihood-ratio chi2(尤度比検定)
ただし、カイ二乗検定を、2×2表の検定に用いる場合には、以下3つの前提がすべて満たされていることが必要。
1)サンプル数が>20
2)すべてのセルの"期待数"(実数ではないことに注意)が1以上
3)4つのうちのセルのうち最低3つで、期待数が5以上
こうした前提が満たされない場合にはFisher's exact test(フィッシャーの正確検定)やlikelihood ratio test(尤度比検定)を用いる。
また、カイ二乗検定は、3段階以上の"順序"のあるカテゴリー変数には不適切である。その場合、chi-square test for trend(傾向性のカイ二乗検定)や、Mann-Whitney U test(マン・ホイットニーのU検定)の方が適切。
※参考&文引用:国際誌にアクセプトされる医学論文 p109
◆1,正規分布かどうかの判定の実施
正規分布かどうか判定するためのSTATAコマンドは以下の通り。
sktest 変数
また、変数を並べて一気に判定を行うことも可能。
sktest 変数1 変数2 変数3 …
結果、Prob>chi2が0.05未満であれば正規分布ではない=ノンパラメトリック
0.05以上であれば正規分布=パラメトリックなのでt検定等が可能。
※出展:stataによる医療系データ分析入門 p139、p310
ちなみに、基本統計量とかの表示において、正規分布している変数は「平均値(標準偏差)」で示すが、非正規分布の変数は「中央値(25%~75%)」の値で示す。(p138~p141)
この時のSTATAコマンドは
sum 変数,detail
…とあるけれど、、、実際に経済学領域の先行研究を見てみるとあまり(25%~75%)の表記は発見できず、平均値(標準偏差)という表記で行われている。。。。このあたり要確認。
ちなみに医学系の参考図書では以下。
「ノンパラメトリック法を用いる場合には、中央値medianとブーストラップ法による95%信頼区間を記載するようにします。変数に多くの同値やゼロ値を含む場合には中央値とブーストラップ法の95%信頼区間を用いる方が適切です。ホッジス-レーマン推定量Hodges-Lehmann estimatorは統計学的にはより適切かもしれませんが、研究によっては複雑すぎるかもしれません。
※出展:国際誌にアクセプトされる医学論文 p117
◆2群のt検定は3群以上ではできない
2群の場合、t検定が使われることが多いが、3群以上でt検定はできずF検定を行う。その理由については以下。
3 つの標本 A, B, C が与えられたとき、t 検定を繰返し使用したら何が悪いのでしょうか?今、検定の有意水準 α を 5% とすると
(1) A-B 間の比較で有意差が検出されない確率 = 0.95
(2) A-C 間の比較で有意差が検出されない確率 = 0.95
(3) B-C 間の比較で有意差が検出されない確率 = 0.95
ですから、3 回の検定を通じて有意差が検出されない確率は 0.953 = 0.86 となります。逆に言えば (1), (2),(3) のいずれかで有意差が検出される確率は 1 − 0.86 = 0.14 となり、正しい帰無仮説を棄却してしまう過誤
(第 1 種過誤)の確率が本来の 5% よりも大きく増大するといった問題が生じます。
このため標本数が 3 以上の場合には分散分析 (ANOVA: analysis of variance) という手法が用いられます。
これはすべての平均値間に差がないことを F 検定によって確認しようとするものです。しかしこの仮説が棄却された場合に、どの平均とどの平均の間に有意差が認められるかについて、分散分析自体は何ら情報をもたらしません。このため、有意確率の補正を伴う多重比較 (multiple comparison) 検定を併用することが通常行われます
oneway fb18b1 class, tabulate
または、このペーパーで紹介されている方法
3)検定
帰無仮説が係数=0 の t 検定と、帰無仮説がすべての説明変数の係数=0 の F 検定は、regressコマンドで出力された統計量を用いて行うことができます。その他の検定を行うにはregression を行ったあとに test コマンドを用いるなどして行います。その例をいくつか紹介します。
■F 検定
reg lwage educ exper tenure [enter]
test educ exper [enter]
とすると、educ の係数=0 および exper の係数=0 が帰無仮説である F 検定を行うことができます。
なお、医学系の参考書をみると、
「…従来は、正規分布するデータにはパラメトリック検定を、分布が歪んでいる場合にはノンパラメトリック検定を用いるとされてきました。しかし、最近ではデータの分布の形状にかかわらず、ノンパラメトリック検定を用いることが普通となっています。」
「…医学的研究の対象者は異常を抱えた患者であり、これらの患者から得られたデータも正常ではないことが多いと考えるのが合理的です。また、サンプルサイズが大きくない限り、データが正規分布しているかどうかを証明することは不可能です。パラメトリック検定を用いる限り、つねに査読者から、正規性の前提が満たされているかどうかが問われることになります」
(※出展:国際誌にアクセプトされる医学論文 p115-p116)
検定方法や3群の検定に関する説明として以下の記事も大変勉強になる。
・改訂増補版:統計検定を理解せずに使っている人のためにIII
(東北大学未来科学技術共同研究センターIkuo Ikeda)
・使える!統計検定・機械学習 : II : 3群以上の場合 の有意差検定PDF
(高木 英行 九州大学大学院芸術工学研究院)