p値に関するASAの声明:背景、プロセス、目的
本文へスキップ
Taylor and Francis Online ホームページ
ログインまたは登録
カートに入れる
検索、閲覧、出版
The American Statistician
第70巻、2016年 - 第2号
フリーアクセス
775,489
閲覧
4,
175
CrossRef 現在までの引用
2,
324
Altmetric
Listen
Editorial
p値に関するASAの声明:背景、プロセス、目的
The ASA Statement on p-Values: Context, Process, and Purpose
https://www.tandfonline.com/doi/full/10.1080/00031305.2016.1154108#d1e167
Ronald L. Wasserstein &Nicole A. Lazar
Page 129-133|Published online: 09 Jun 2016
この記事を引用する
https://doi.org/10.1080/00031305.2016.1154108
CrossMark LogoCrossMark
論文内容
関連研究
PDF(別ウィンドウで開きます)
シェアする
前の記事へ
次の記事へ
The ASA's Statement on p-Values: Context, Process, and Purpose
Ronald L. Wasserstein &Nicole A. Lazar
Page 129-133
2014年2月、マウント・ホリヨーク・カレッジの数学・統計学名誉教授であるジョージ・コブは、ASAのディスカッション・フォーラムに次のような質問を投げかけた:
Q: なぜ多くの大学や大学院ではp = 0.05と教えているのですか?
A:科学界やジャーナル編集者がいまだにそれを使っているからです。
Q: なぜ多くの人がいまだにp = 0.05を使っているのですか?
A: 大学や大学院でそう教わったからです。
コブの懸念は、p < 0.05のような明瞭な線の使用に基づく、科学社会学における長い間懸念されてきた循環性であった。この懸念は、ASA理事会の注意を喚起した。
ASA理事会はまた、ここ数年の非常に注目された議論からも刺激を受けた。例えば、ScienceNews(Siegfried Citation2010)は、"It's science's dirtyiest secret: The 'scientific method' of testing hypotheses by statistical analysis stands on a flimsy foundation. "と書いた。2013年11月、Phys.org Science News Wireの記事(Citation2013)は、帰無仮説の有意性検定における「多数の深い欠陥」を挙げている。2014年2月7日のScienceNewsの記事(Siegfried Citation2014)は、"仮説を検証するための統計的手法には...フェイスブックのプライバシーポリシーよりも多くの欠陥がある "と述べている。その1週間後、統計学者で "Simply Statistics "ブロガーのジェフ・リークが反論した。「問題なのは、P値の使い方が悪いことではなく、データ分析の大部分が、データ分析を行うための適切な訓練を受けた人によって行われていないことである」とリークは書いている(Leek Citation2014)。同じ週、統計学者で科学ライターのレジーナ・ヌッツォが『ネイチャー』に「科学的方法」と題する論文を発表した: 統計的エラー」(Nuzzo Citation2014)。この論文は、altmetric.com(http://www.altmetric.com/details/2115792#score)が報告しているように、現在最も閲覧数の多いネイチャー誌の論文の一つとなっている。
もちろん、単に印刷されたいくつかの記事に反応しただけの問題ではない。統計コミュニティは、科学的結論の再現性と複製可能性の問題に深い関心を寄せてきた。これらの用語の定義や区別に立ち入るまでもなく、科学の妥当性について多くの混乱や疑念さえ生じている。そのような疑念は、p値(帰無仮説の有意性検定)の禁止を決定した『Basic and Applied Social Psychology』編集部のような急進的な選択につながることもある(Trafimow and Marks Citation2015)。統計的推測の誤解や誤用は、「再現性の危機」(Peng Citation2015)の原因の一つに過ぎませんが、私たちのコミュニティにとっては重要なものです。
ASA理事会がp値と統計的有意性についてのポリシー・ステートメントを作成するという課題に取り組むことを決定したとき、これは軽々しく踏み出せるものではないことを認識してのことでした。ASAはこれまで、統計実務の具体的な事柄について立場をとることはありませんでした。最も近いところでは、教育評価における付加価値モデル(VAM)の使用に関する声明(Morganstein and Wasserstein Citation2014)と、選挙後の監査のリスク制限に関する声明(American Statistical Association Citation2010)がある。しかし、これらはまさに政策に関連した声明であった。VAMに関する声明は、重要な教育政策の問題を取り上げ、関連する問題の複雑さを認め、効果的なパフォーマンス・モデルとしてのVAMの限界を挙げ、統計学者の関与のもとでVAMを開発し解釈するよう促している。選挙監査に関する声明も、主要だが具体的な政策課題(2008年の接戦選挙)に対応したもので、統計に基づく選挙監査を選挙プロセスの日常的な一部とすべきだとしている。
対照的に、理事会は、p値と統計的有意性についてのASA声明が、広範な研究コミュニティにおいてあまりにも誤解され、誤用されがちな我々の分野の側面に光を当て、その過程でコミュニティにサービスを提供することを想定している。想定される読者は、主に統計学者ではない研究者、実務家、科学ライターである。従って、この声明はこれまで試みられたものとは全く異なるものとなる。
理事会はワッサースタインに、さまざまな視点を代表する専門家グループを集めるよう命じた。理事会を代表して、ワッサーステインは20人以上の専門家にコンタクトを取った。何人かは合意に達することができるかどうか疑問を示したが、そのうちの何人かは、事実上、話し合いが行われるのであれば参加したいと言った。
何カ月もかけて、グループのメンバーは声明文の形式について話し合い、声明文の読者をより具体的にイメージし、合意点を見つけようとした。それは比較的簡単なことであったが、激しく意見が対立する点を見つけるのも同じくらい簡単であった。
そこで2015年10月、バージニア州アレクサンドリアにあるASAオフィスに20人のメンバーが集まった。2日間のミーティングはレジーナ・ヌッツォがファシリテーターを務め、ミーティングが終わるころには、ステートメントを作成するための良いポイントがまとまっていた。
その後3ヶ月間、グループメンバー、理事会メンバー(2015年11月のASA理事会で長時間の議論が行われた)、そしてターゲットオーディエンスのメンバーによって、ステートメントの草案が何度も見直された。最終的に、2016年1月29日、ASAの執行委員会は声明を承認した。
声明の作成プロセスは予想以上に長く、論争も多かった。例えば、複数の潜在的比較(Gelman and Loken Citation2014)の問題にどのように対処するのが最善かについて、かなりの議論があった。また、「0.05に近いp値は、それだけでは帰無仮説に対する弱い証拠にしかならない」(Johnson Citation2013)という言葉の背後にある問題について、かなり長い間議論しました。p値に対する様々な選択肢をどのように特徴づけるか、また、それらをどの程度詳細に扱うかについては、見解が分かれた。ステートメントを合理的にシンプルに保つために、我々は代替仮説、エラータイプ、検出力(とりわけ)には触れませんでしたが、全員がそのアプローチに同意したわけではありません。
声明の作成が終わりに近づいた頃、WassersteinはLazarに連絡し、The American Statistician (TAS)に掲載するのが適切ではないかと尋ねた。検討の結果、LazarはTASが広く一般的な統計読者にリーチする良いプラットフォームになると判断した。さらに、オンラインディスカッションを加えることで、TASの読者の関心を高め、前述の論争を反映させる機会を与えることができると考えた。
そのため、討論者のグループに連絡を取り、声明に対するコメントを提供してもらった。