見出し画像

アウトカムワイド研究という言葉

以前、とある省庁への報告書を書いていたとき、その省で親切にしてくれたひとと交わした言葉が今も心に残っている。

――ほぬーさん、5%有意ってことは、100個の組み合わせで分析したら偶然5個は有意になるってことじゃないですか。それって本当に「相互に関連し合っている」って言っちゃっていいんですか?

この考え方が合っているかどうか自体はわたしにはわからないけれども、感覚的には確かになあと思った。わたしは今でこそそこそこ統計のことはわかっているつもりになっているけれども、元々は京大系のゴリゴリのフィールドワーカーだった。だから、今所属しているグループが、アウトカム変数に対して思いつく変数を全て説明変数に投入して有意とか有意じゃないとか言っていることにはずっと疑問があった。

確かに公衆衛生学は、悪魔の仕業であるコレラと下水道設備有無との間に集計的な差があるということを発見したことに始まるわけで、メカニズムは解明できなくとも、そこに差があることを発見することは重要だという考え方は理解できる。

けれども、何でもかんでもぶち込めば何かは偶然当たるし、それに後からコリクツをつけて論文完成!っていうのは違うと思う。だったらもういっそ10指標とって10x9=90通りの組み合わせがあり得るから、4.5個は有意になるわけで、そこからコリツクのつけやすいものを選べばいいじゃんか、って話になるじゃん。

って思ってたら、最近「アウトカムワイド研究」という言葉があるんだそうな。というか、尊敬している先生の研究グループがこぞってこれをやっていた。どういうものかというと、目的変数をワイドに(要は全部投入)、説明変数も考えられるもの全てを投入。赤鉛筆で有意だったやつに○印をつけて、似たような組み合わせの先行研究を探してその先行研究との異同を語っていっちょあがり。

なんかね。もちろんそうせざるを得ない社会問題ってあると思う。説明変数と目的変数は違う調査から持ってきているとか。でも多くの調査の場合、人間はそこに居るわけじゃないですか。どういうメカニズムでそうなったのか。観察して、ヒアリングして、その答え合わせを統計でする。あるいは、統計で得られた結果(チャンピオンケースでもいいしポップアウトデータでもいい)について、なぜそんなことが起きているかを見に行ったらいい。

でも、一番の問題は研究者の質ということではないと思う。あらゆる創作物は、それが芸術作品であれ研究論文であれ、受け手の感情を動かして相手の行動を変容させることが目的だ。つまり、査読者であったり、読者であるわたしたちであったりが、統計有意であればそれだけで感情を動かされてしまっていることが問題なんじゃないかと思う。

いいなと思ったら応援しよう!