仮説検定とP値の誤解:統計的推論の正しい理解に向けて


こんにちは。今回は、京都大学大学院医学研究科の佐藤俊哉教授による「仮説検定とP値の誤解」についての講演内容をご紹介します。統計学は医学研究において非常に重要な役割を果たしていますが、その解釈には多くの誤解が存在します。今回の講演では、これらの誤解を解き、正しい統計的推論の方法について詳しく解説されています。

1. はじめに:P値と仮説検定の問題点

統計学において、P値や仮説検定は長年にわたって誤解されてきました。この問題は30年以上前から指摘されていましたが、近年になってようやく社会的、科学的に大きな問題として認識されるようになりました。

そのような背景の中、アメリカ統計協会(ASA)が2016年にこの問題に関する声明を発表しました。この声明は、統計を専門としない研究者や実務家、そしてサイエンスライター向けに書かれたものです。

今回の講演では、このASA声明を中心に、以下の内容について解説されています:

  1. 検定とP値についての一般的な誤解

  2. なぜそれらが誤解であるか

  3. 検定の基本的な考え方

  4. 誤解を避けるための方法

それでは、具体的な内容を見ていきましょう。

2. P値と仮説検定の誤解:実例から学ぶ

まず、P値と仮説検定に関する誤解について、実際の研究論文を例に説明されました。取り上げられたのは、2017年のNew England Journal of Medicineに掲載された「EUCLID試験」です。

2.1 EUCLID試験の概要

この試験は、末梢動脈疾患患者の心血管イベント予防効果について、チカグレロル(新薬)とクロピドグレル(既存薬)を比較したランダム化二重盲検臨床試験でした。

主要エンドポイントは、心血管死、心筋梗塞、脳梗塞のいずれかが最初に起こるまでの時間でした。

2.2 試験結果と解釈

試験の結果は以下の通りでした:

  • チカグレロル群:7013名中751件のイベント発生

  • クロピドグレル群:7015名中740件のイベント発生

  • ハザード比:1.02(95%信頼区間:0.92-1.13)

  • P値:0.65

研究者たちは、この結果から「チカグレロルはクロピドグレルと比較して心血管イベントの減少に関して優越性を示さなかった」と結論づけました。

この結論は正しいものですが、P値や仮説検定の結果の解釈には様々な誤解が存在します。以下、そういった誤解について詳しく見ていきましょう。

3. P値と仮説検定に関する一般的な誤解

佐藤教授は、P値と仮説検定に関する以下のような一般的な誤解を指摘しました:

  1. P値は帰無仮説が正しい確率である

  2. 統計的に有意であることは、科学的に重要な関係があることを意味する

  3. 有意でない検定結果は、帰無仮説が正しいことを意味する

  4. P値が0.05より大きければ、効果がなかったことが証明された

  5. 有意な検定結果は、帰無仮説が誤りであり棄却すべきであることを意味する

  6. P値が0.01ということは、100回に1回しか起こらないことが起きたということである

  7. アルファレベルを5%に設定して帰無仮説を棄却した場合、その判断が誤りである確率は5%である

これらはすべて誤解であり、正しい統計的推論を行う上で避けるべき考え方です。では、なぜこれらが誤解なのでしょうか。

4. アメリカ統計協会(ASA)の声明

ここから先は

6,546字

¥ 500

この記事が気に入ったらチップで応援してみませんか?