医療統計における多重比較検定の基本とその使い方
多重比較検定は、複数のグループ間で統計的に有意な差があるかを判断するための手法です。ここでは、Bonferroni、Holm、Post-hoc、Steel-Dwass、Steelの多重比較検定について、日常業務や身近な例を用いて解説します。
1. Bonferroniの多重比較検定
特徴: Bonferroni法は各比較での有意水準を全体の有意水準で割るシンプルな方法です。
例: 患者の血圧を測定し、薬A、薬B、薬Cの効果を比較したいとします。3つの薬の効果をペアで比較する場合、比較数は3通り(A-B、A-C、B-C)です。有意水準を0.05と設定すると、Bonferroni法では各比較の有意水準は0.05/3 = 0.0167になります。
メリット: シンプルで容易に理解できます。偽陽性(Type Iエラー)を防ぎます。
デメリット: 非常に保守的で、偽陰性(Type IIエラー)のリスクが増えます。
2. Holmの多重比較検定
特徴: Holm法はBonferroni法を改良したもので、各比較のp値を昇順に並べ、段階的に有意水準を調整します。
例: 上記の血圧測定の例で、各ペア比較のp値を小さい順に並べます。最初の比較では有意水準を0.05/3、次に0.05/2、最後に0.05とします。
メリット: Bonferroni法よりも検出力が高いです。
デメリット: 比較の数が多いと検出力が低下する可能性があります。
3. Post-hoc検定
特徴: Post-hoc検定は、ANOVAなどの分散分析後に行う比較検定です。Tukey、Scheffé、Dunnettなどの方法があります。
例: 4つの治療グループ(薬A、薬B、薬C、薬D)の間で患者の血糖値を比較したい場合、ANOVAで全体の差を確認した後、Tukey法を用いて具体的なペア比較を行います。
メリット: グループ間の詳細な比較が可能です。
デメリット: 適切な方法を選択する必要があります。
4. Steel-Dwassの多重比較検定
特徴: Steel-Dwass法は、非正規分布のデータに適したノンパラメトリックな多重比較検定です。
例: 患者の疼痛スコア(0~10のスケール)を薬A、薬B、薬Cで比較したい場合、データが正規分布しない場合でもSteel-Dwass法で各ペアの比較が可能です。
メリット: 非正規分布や等分散性が仮定されません。
デメリット: 計算が複雑で、手動では実施が難しいです。
5. Steelの多重比較検定
特徴: Steel法は、特定のコントロールグループと他の全てのグループを比較するノンパラメトリックな検定です。
例: コントロールグループ(プラセボ)と3つの治療グループ(薬A、薬B、薬C)の間で患者のコレステロール値を比較する場合、Steel法でプラセボと各薬の効果を個別に比較します。
メリット: 非正規分布や等分散性が仮定されません。コントロールとの比較が明確です。
デメリット: 全てのペア比較を行う方法ではないため、比較が限定されます。
まとめ
各検定方法には一長一短があります。データの特性や研究の目的に応じて適切な検定方法を選択することが重要です。多重比較検定を適切に活用することで、臨床研究や診療の質を向上させることができます。スタッフ間で情報を共有し、理解を深めることで、より効果的な医療サービスを提供できるようになります。
いただいたサポートは医療系クリエイターSAKAIの活動費として活用させて頂きます。