p値の定義や考え方について、様々な本で記されているが、以下の定義がしっくりくる。

・p値とは2つの集団が同じである確率。フィッシャー博士が農薬試験の評価において「p値が5%未満の時に統計的に有意である(statistically significant」と放言して以来、最もよく使われるカットオフ値。
・p値は「本当は2つの集団が同じなのに、異なると誤った判断をしてしまう確率」という解釈もできます。
(Stataによる医療系データ分析入門 p57)

また、p<0.05など有意な関係を見出したとき、「両者に相関関係がある」としてしまってよいか?

答は、「バイアスがなくすべての交絡が補正されている」という前提があれば、相関があるといえる。

しかし、バイアスが全くない研究は稀であり、すべての交絡を補正するには十分な人数のランダム化しかない。

したがって、観察研究には限界がある。そのため、…

・観察研究の要旨の結論部分には、ほぼ決まって、"These results suggest that exposure A may associate with B" というようにmayを使う。
・一方、大規模な二重盲検ランダム化比較試験では、"Exposure A improved outcome B"というように結論をしばしば断定している。大規模と注釈したのは、人数が少ない場合、本当は差がないのに「偶然」差がついてしまうこともあり得るからです。

とのこと。
(出展:Stataによる医療系データ分析入門p41-p42)

また、おいしい批評生活で紹介されている以下の論文も参考。

Wasserstein, Ronald L. and Nicole A. Lazar. 2016. "The ASA's Statement on p-Values: Context, Process, and Purpose." American Statistician 79(2): 129-33.

いいなと思ったら応援しよう!