【読書メモ】信頼性について基礎から学び直せるテキスト:『心理尺度構成の方法 基礎から実践まで』(小塩真司編)
『心理尺度構成の方法 基礎から実践まで』の5章のタイトルは「心理尺度における信頼性」です。個人の印象ですが、心理統計についての基礎は、授業でも聞き、本でも何回も読んでいる内容でも頭に定着してくれません。その場では理解していると信じているのですが。信頼性について理解があやふやな方は、ぜひ本書の5章を読んでみてください!以下では簡単にまとめます。
古典的テスト理論と項目反応理論
ある分野についてよくわかっていない理由の一つには、扱われる概念間の関係性、もっと言えば概念の「粒感」を把握できていないことがあるのではないでしょうか。論文で信頼性に関する記述を読んでいると、クロンバックのα係数、マクドナルドのω係数、再テスト信頼性、テスト情報関数などが出てきて頭の中が混乱しがちです。
これらを括るものには古典的テスト理論や項目反応理論といった理論があります。
まず見取り図を押さえると、α係数、ω係数、再テスト信頼性は古典的テスト理論によるものであり、テスト情報関数は項目反応理論に基づくものです。この関係性を把握すると少しは理解がしやすくなるのではないでしょうか。
再テスト信頼性
再テスト信頼性(test-retest reliability)は、「時点間の得点同士の相関係数」(p.79)を指し、再検査信頼性とも訳されるものです。たとえば、ある時点で質問項目に対して回答したものと、少し後に回答したものがあまりにブレるものだと、そもそもその質問項目がどうなの?ということになりますよね。この点を検証するのが再テスト信頼性なのです。
再テスト信頼性でどの程度の時点の間隔を空けるかについての決まりはなく、研究で扱う概念や対象者の特徴に合わせて決定することになります。また、どの程度の相関係数があれば良いのかに関するガイドもあるようでないのが現状で、「.50や.70など、研究者によってさまざま」(p.80)だそうです。
α係数
α係数は分析でよく使うので理解しているつもりなのですが、「ところでα係数ってなんですか?」と端的に尋ねられると分かりやすく答える自信はありません。このような質問に対して端的に言語化してくれているのが本書なのです。
いやはや、α係数は統計ソフトではとても簡単に算出でき、どの程度の値があれば良いかも肌感があるので素通りしてしまいがちですが(私だけ?)、こうしたそもそも論を理解することはとても大事です。自戒を込めて。
これも私だけかもしれませんが、尺度開発論文を書いていた時、信頼性の検証にクロンバックのα係数を用いて記述した後、妥当性のパートを記述しようとした時に「クロンバックのαでなんで妥当性を言えないんだっけ?」と疑問に思った時がありました。その時は妥当性に関する内容(本書の6章で後日まとめます)を理解し直して書いたのですが、どうやら初学者にはあるあるのことなのかもしれません。というのも以下のように両者の相違について書いてくださっているのです。
痒いところに手が届く記述で個人的には感激しました。信頼性と妥当性を査読論文として書いてみると、この感動をおぼえられるかもしれません。
ω係数
近年では、α係数とともにω係数を提示してください、という査読コメントを受けることが増えてきたようです。α係数とω係数では、「真の得点」というものを想定してその分散をどちらも見ているという共通点があります。
他方で相違ももちろんあります。α係数は「共通因子と各項目に固有の特殊因子の分散の和」(p.82)を表しているのに対して、ω係数は「信頼性係数は特殊因子を含まない点で「厳密な」信頼性係数」(p.83)と評価できるようです。そのため、α係数よりもω係数の方が優れているという指摘が出てくるようになり、ω係数が言及されている論文が増えてきていると紹介されています。
ただ、ほとんどの場合にはα係数とω係数が併記されているようなので、α係数がダメになったということではない点は留意が必要でしょう。
おまけ
SPSSを動かしていると、誤差項を設定することがままあるのですが、その時に「e」を頭につけます。なんで「e」なんだろうと思いつつ、機械的にやってしまっていたのですが、誤差(error)の頭文字なんですよね。今更ながら知りました。汗
最後まで目を通していただき、ありがとうございました!