心理尺度を作るときのサンプルサイズはどれくらい必要なのか
「研究をするための研究」という研究分野があるのをご存じでしょうか。研究者たちが日々研究を行って,論文を書いていくのですが,その論文を集めてある観点から分析を行い,「研究者たちはこのような営みで研究を行っている。しかしこうするべきだ」と,現状の把握と研究方法の改善への提言を行っていくような,「研究」です。
たぶん,研究に携わっていない人々からすれば,全く何の役に立つのかわからない研究なのかもしれません。しかし,ある分野で研究活動をしてる人たちからすれば「このことが知りたかった」と思うような研究になることもあるのです。
ひとつの例
たとえば,私自身の論文で恐縮ですが,『心理尺度構成における再検査信頼性係数の評価―「心理学研究」に掲載された文献のメタ分析から―』という論文があります。心理尺度を作るときに,いったいどれくらいの再検査信頼性係数(2時点間の相関係数)が報告されているのかをメタ分析を使って検討したものです。
過去の研究から相関係数を抜き出して統合すると,ρ = 0.76という値になっていました。これくらいが,再検査信頼性係数の目安だということになります。たぶんこれも研究をしない人にとってはどうでもいい情報なのかもしれませんが,研究をしていて「どれくらいなら再検査信頼性係数が十分だと言えるのだろう」と疑問に思っている人にとっては,有用な情報だと言えそうです。
サンプルサイズ問題
さてこれも,色々なところで聞くにもかかわらず,特に決定的な答えがないという問題ではないでしょうか。
◎項目数に対して何人のサンプルサイズを集めれば良いのか
という問題です。
これまた,いろいろなところに色々なことが書かれている印象があります。「項目数かける5のサンプルを集めなければいけない」とか「項目数かける10のサンプルを集めるべき」とか。
以前にもこの問題について記事を書いたことがあります。
そこでは,いろいろ言われているけれど決定打はないという話になっていました。
もしも「項目数×5」でよいのなら,たった10項目で構成される自尊感情尺度やTIPI-Jといった心理尺度を作成するときには,50人に調査をすればよいことになってしまいます。が,それではやはり「少ない」という印象があります。
実際のサンプルサイズ
こういうときには,実際に研究者たちがどれくらいのサンプルサイズを研究の中で集めているのかを調べてみるのがよいのではないでしょうか。そこで,実際にこの問題に取り組んだ研究を見てみたいと思います。こちらの論文です(Sample size used to validate a scale: a review of publications on newly-developed patient reported outcomes measures)。
この記事が気に入ったらサポートをしてみませんか?