医療従事者のための楽する統計
0,この文章の目的
医療従事者がスライド発表や論文作成で統計を使う場合の楽な方法について書きます。
1,統計はなぜ難しいか?
統計の本は大きく3つに分かれると思います。
統計がいかに便利であるかを紹介する本
はじめての人でも統計ができる本
統計が数式でわかる本
スライド発表や論文作成を目的とするのであれば2番目の「はじめての人でも統計ができる本」を手にとるのではないでしょうか?
「はじめての人でも統計ができる本」には弱点があると思っています。データの集め方や正規分布、標準偏差あたりまでは丁寧な説明があるものの二項分布、t検定あたりからの説明は非常に雑になってきます。ここがわからないと3番目の「統計が数式でわかる本」に手を出してしまう人がいるでしょう。しかし、これは間違いです。数式が理解できなくて”やはり数学ができないと統計は無理”という結論に至ってしまいます。
多くの人は自信をもって結果が有意なのかそうでないのか示したいと思っているはずです。しかし、どの検定を使っていいのか自信がない、計算はあっているのだろうか、サンプル数は十分なのだろうかと考えていることでしょう。この不安を解消しないと統計は難しいという状況から抜け出せません。
2,どうすれば統計で楽できるか?
結論は簡単です。人の論文を見て真似をしましょう。どのような検定を使うのかがわかったらその検定だけ勉強すれば良いでしょう。
具体的にどうするかについても書いていきます。
3,どのような統計手法が使われるか?
実際にJSPENの「学会誌JSPEN Vol.6 No.1」から「学会誌JSPEN Vol.6 No.4」を参照すると以下のような統計手法が見られました。
Wilcoxonの順位和検定 (Mann -Whitney U検定)
Wilcoxonの符号順位検定
Wilcoxonの符号順位和検定
t検定
カイ二乗検定 (Χ二乗検定、Chi-square検定)
フィッシャーの正確確率検定
相関係数
単変量・多変量解析
"Wilcoxon"で始まる検定はどのようなデータに対して行うのかは理解しておきたいところです。符号があるかないか、順位か順位和かで異なるので注意したい。原理は簡単なので教科書で理解しやすいです。
t検定、カイ二乗検定は頻出であり2群の比較によく使用されます。頻出なので例はいくつもあるので事例を研究しやすいです。フィッシャーの正確確率検定はカイ二乗検定に似た別手法のような位置づけです。
相関係数、単変量・多変量解析はその他の手法といった感じでしょうか?
4,具体的な研究の進め方
まずやりたいことに似たような研究を論文で見つけましょう。論文は査読が入るので統計が正しいかどうかはチェックされていることが多いです。データの必要サンプル数などもすでにある論文より傾向をみましょう。学会の研究発表やポスター発表はチェックが無いと間違った統計手法が使われていたり計算間違いがある可能性はあります。
"Wilcoxon"で始まる検定なのかそうでないのかは大きな分岐点なので注意して選択しましょう。どのようなデータに対してどの"Wilcoxon"で始まる検定が選択されているかを確認しましょう。
t検定とカイ二乗検定は頻出なので使えるようにしておきましょう。t検定は2群の平均、標準偏差、サンプル数がわかればp値を算出できるので論文の計算があっているか検算してみましょう。カイ二乗分布も2群の数値があればp値を検算できるのでやってみましょう。
相関係数、単変量・多変量解析は比較的に手順は簡単だと思います。p値の解釈が間違いやすいので注意が必要です。個人的には多変量解析をやるならその意義を考えてもらいたいと思います。
すでにある論文でどのような検定をするのか事前に考えてから研究すべきです。とりあえずデータを集めてどの検定に当てはめるか後から考えるのは少し苦労しそうです。
5,楽をしても間違うな
統計の意義はまず自分が検定を行ってその統計手法で有意さがある、ないと確かめることにあります。その発表は自分が確認した結果を第三者に信用してもらうことでしかありません。間違いを見た人が気づいてくれるだろうという考えではいけません。
統計手法が正しいか計算が正しいかは誠意をもってチェックすべきです。手法が間違っていても計算ソフトに数値を入れればそれらしい答えが出ます。しかし、正しいデータを用いた検算で確認は必ずしましょう。
統計は間違った使い方をすることで相手を欺くこともできますがそのようなことはすべきではありません。
6,p値の理解
p値はその検定でその結果が出たという数値にすぎず、そのやり方でその結果ならそれを信じていこうという目安にすぎません。p値が有意差を示したからと言って、その結果は疑いのないものだと言い切ることはできません。
p値についての理解は残念ながら楽にできるものではありません。p値を理解するために検定は具体的に何をやっているか、検定値、自由度、分布図などの理解が必要になると思います。
さらに残念なことにp値は論文や発表を見た人のほとんどが、医療者であればなおさら、正確に理解していません。しかし、経験としてある検定で有意な差を出すのがどれくらい難しいのかを知っている人であれば、結果を見てp値の意味を理解できるでしょう。
7,最後に
論文に投稿される執筆者が「統計が数式でわかる本」のような数式を完全に理解しているとは思えません。ただ、すでにある論文を参考にして、研究をよくある研究方法にして、計算式が正しいかの検証も行いつつ、その過程で統計手法の知識を深めるといけば、だれでも統計を使った研究発表が可能だと思います。
この記事が気に入ったらサポートをしてみませんか?