カイ2乗検定で比率の差を検定
東京大学医学部老年病科の矢可部です。
基礎、臨床研究の統計解析でRを用いています。
学生や研修医の指導に使うという目的もあり、noteに記事を書いています。
今回は、群間での比率の差を検定するカイ2乗検定のやり方を解説します。
2群でのカイ2乗検定
クロス集計表を作ると以下の通りです。
Rに表形式のデータを取り込むには、以下のように入力します。
ここで"2, 2"とありますが、1つ目が行数、2つ目が列数です。
列ごとに(縦方向に)数字を入れていくことに注意してください。
作成したdatを表示すると、2×2の形で正しくできていることがわかります。
カイ2乗検定を行う場合、以下のように入力します。
結果は以下のように表示されます。
P値が0.05を超えているので、「男女比率に有意差はない」という結果になりました。
なお、上で出てくるイエーツの連続性補正の説明はここでは割愛します。
詳しい説明、どのような場合に行うかなどについては、以下のサイトなどをご覧ください。
3群以上でのカイ2乗検定
カイ2乗検定は3群以上でもできます。ただし、少し工夫が必要です。
クロス集計表は以下の通りです。
まず、表を作成します。
dat2を表示すると以下のようになります。
カイ2乗検定を行うコマンドは、基本的に2群の場合と変わりありません。
P値が0.05より低いので、「3群間で男女比率に有意差がある」という結果になりました。
ただしこれだけでは、どの2群間に有意差があるかはわかりません。そこで、2群ごとにカイ2乗検定を行います。
AとB, AとC, BとCのそれぞれでカイ2乗検定を行うと、以下の結果が得られます。
注意点として、ここでは検定の多重性が問題となります。
同じデータに対して3回の検定を繰り返しているため、有意水準が0.05のままだと有意差が出る確率が上がってしまいます。
そのためボンフェローニ法を用います。これは有意水準を総検定数で割った数値を基準にするというものです。
今回は有意水準0.05を3で割り、
より、p < 0.0167であれば有意差ありと判定します。
例題2では、AとB, BとCでは割合に有意差があり、AとCには有意差がないという結果になります。
今回は以上です。
この記事が気に入ったらサポートをしてみませんか?