基準とは何だろうか
その昔,大学院生の頃のことです。とある先生がこう言っていました。
「よくわからないのに『何々妥当性』という言葉を安易に使わないほうがいい」
ということで今回は,この『何々妥当性』のうち,基準関連妥当性(criterion-related validity)という言葉について考えてみようと思います。この話は,心理学で質問紙尺度を使おうとする時以外にはあまり関係のない話だと思うかもしれません。しかしこれは,テストを作ろうというときや,何かで人を選別しようとするとき,合格・不合格を出そうとするときにも共通する問題になりえることです。
大前提
どうして妥当性ということが問題になるのでしょうか。
それは,テストがそのままストレートに測りたいことを測っているわけではないからです。でも,「国語のテストは国語の学力を測っているじゃないか」と思うかもしれません。
しかし,ある国語のテストは国語の学力そのものの反映ではありません。そもそもそのテストは,国語の学力全体を測るには問題数が少なすぎます。覚えるべき漢字をすべて問題に含んでいるでしょうか。理解している文法の問題をすべてテストの中に含んでいるでしょうか。読むべき説明文をすべて問題に含めているでしょうか。テストは,測定したいもの全体の「一部」しか含むことはできません。特に定期テストや入学試験などの場合はそれが顕著になります。
そして,問題が応用的になるほど,そこには複数の要素が入ってきます。覚えていることを組み合わせる,理解している複数の要素を組み合わせる,読解力と文法の能力が両方必要になる,などです。すると,本当にそのテストが国語の学力を反映していると言えるのかどうか,何らかの形で確かめた方が良いかもしれない,という話になっていきます。
そこで,「測定することが測定したい内容をちゃんと反映しているか」という妥当性のことを考える必要が出てくるというわけです。
3つの妥当性
ずいぶん昔から,「妥当性には3つある」という枠組みで,妥当性を考えてきました。私も学生の頃はそう習いましたし,今でも「○○妥当性」というかたちで論文に書かれることもあります。それは,次の3つです。
◎内容的妥当性:測定している内容が,測定範囲を過不足なくカバーしているかどうかという問題
(内容的妥当性に問題がある例)算数の試験の中に,国語の文法がわからないと解けない問題がある。
◎基準関連妥当性:測定している内容が,基準とどれくらい関連しているか,予測するかという問題
→併存的妥当性:同時に測定される基準との関連
(例:抑うつの程度を測定するテストと,医師のうつ病の診断との関連を検討する)
→予測的妥当性:将来生じる基準との関連
(例:抑うつの程度を測定するテストと,10年後のうつ病の発症経験との関連を検討する)
◎構成概念妥当性:測定している内容が,測定しようとする構成概念をどれくらい反映するかという問題
→収束的妥当性:関連があると予想される概念を測定する指標と,実際に関連がある
→弁別的妥当性:関連がないと予想される概念を測定する指標と,実際に関連がない
全体が構成概念妥当性
妥当性という問題が,「概念を測定するときに問題になること」なのですから,どのような妥当性も構成概念妥当性であるという考え方になるのも自然だろうなと思います。
そこで,最近では先に述べたような妥当性の3分類ではなく,「○○という側面の構成概念妥当性の証拠」という考え方がされるようになってきています。
基準とは何か
さて,話が回りくどくなってしまいましたが,基準関連妥当性の「基準」とは何かということが気になります。これは,論文の査読などをしていて特に気になることです。
先の例のようなケースはわかりやすいのです。「抑うつのテストを作って,医師によるうつ病の診断との関連を検討した」という場合です。この場合,抑うつという概念を測定する心理検査を作って,医師によるうつ病の診断という「基準」との関連を検討したという話になります。
医師によるうつ病の診断は,より測定したい概念内容を直接的に確かめる方法です。それを「基準」と考えると良いのではないでしょうか。つまり,「より測定したい内容を直接反映していて,かつなかなか情報として得にくいもの」です。気軽にお医者さんに「うつ病かどうかを診断してください」とは言いにくいですからね。
心理検査とは何か
このことは,心理検査とは何かという問題にもかかわることだと思うのです。
そして,この「基準との関連」という観点から考えたときには,心理検査とは「本来,とても労力をかけないと得られないような情報に対して,紙と鉛筆を使うだけで容易に得られる情報から推測する方法」であると考えられるわけです。
質問紙でのアンケート調査というのは,それじゃないとわからないようなものではなくて,「楽をしようとしている」のです。
本当は,医師に診断してもらわないといけなかったり,誰かに判断してもらわないといけなかったり,結果が出るまで時間がかかったりするような問題があるのです。それに対して,質問項目に回答するだけで「より簡単に」測定することで,これらの結果を予測するということです。
測定を簡単にすることで,時間的にも労力の上でもメリットが生じます。何時間もインタビューに答えなくても,診断が出るまで何ヶ月も待たなくても,質問に答えるだけでそれを判断できればそれはとても大きな利点です。そうすれば,多くの人々に一斉に調査をすることもできるようになります。
このような背景があるときに,基準関連妥当性という考え方をすることができると思うのです。
気になるケース
論文を読んでいて気になるのは,次のようなことです。
何か別の尺度との関連を検討しているだけで「基準関連妥当性を検討した」と書いてあったり,何か1項目で行動傾向を測定する(たとえば「あなたは過去1週間で何回○○しましたか」などの質問)ことで「基準関連妥当性を検討した」と書いてある場合です。
何が気になるかというと,「それは基準なのだろうか?」ということです。
すでに基準となるような尺度が作られていて,使われているのであれば,わざわざ新しく尺度を作成する必要はないわけです。また,1項目で「基準」が測定できるのであれば,わざわざ何項目も用意して測る必要はなくて,その1項目で測定すれば良いと思うのです。
ということで,本来はなかなか測定できないことをより簡単な質問項目で測定するところにメリットがあるのだという観点があまり感じられないなあ,と思うことがたまにあるのです,というお話でした。
ここから先は
日々是好日・心理学ノート
【最初の月は無料です】毎日更新予定の有料記事を全て読むことができます。このマガジン購入者を対象に順次,過去の有料記事を読むことができるよう…
この記事が気に入ったらチップで応援してみませんか?