見出し画像

テストの等化

テスト理論という、学力テストや心理テストの性質について検討する研究分野があります。
そこで研究されているテーマの一つに「テストの等化」という問題があります。

同じ内容に関連する2つのテスト、たとえば高校3年生を対象とした数学の総合テストが2種類あったとして、これらのテストの点数を比較できるようにスコアを調整するのが「等化(equating)」という操作です。

なぜ、このような操作が必要になるかというと、同じ内容に関連するテストであっても、難易度などの問題の性質が異なっていて、点数を単純には比較できないケースが多いためです。

いま、AとBの2つのテストがあって、Aの平均点が50点、Bの平均点が80点だったとします。Aのテストの方が難しいので、この場合、Aで80点をとった生徒の方が、Bで80点の生徒よりも理解度が高い可能性が大きいと考えられます。

異なるテストのスコアを比較するために、Bで80点の生徒が仮にAのテストを受けていたら何点だったかを推定することができれば便利です。「等化」ではそういった形での調整を行います。

等化が可能な代表的な状況には、以下の3つがあります。

1)AとBの両方を(あまり時間を置かずに)受検した人が一定数存在する(共通受検者デザイン)

2)AとBの両方に、いくつか同じ問題が含まれている(共通項目デザイン)

3)AとBのテストの受検者が、共に母集団からのランダム・サンプリングだとみなせる(ランダム・サンプリング・デザイン)

1番目の共通受検者デザインであれば、複数人の共通受検者について、Aの点数とBの点数を調べることで、Aの点数とBでの点数を結びつけて比較する情報を得ることができます。

それぞれの方法には、固有のメリットとデメリットがあり、2番目、3番目のデザインは、1番目の方法とはまた違ったアプローチで等化を実現します。

大規模テストと呼ばれる多くの受験者を対象とするテストでは、テスト理論の専門家の方達が等化について、色々と検討していることが多いと思います。

等化の具体的な手続きに興味がある方は、ぜひテスト理論や項目反応理論の教科書を調べてみてください。

では




この記事が気に入ったらサポートをしてみませんか?