偏差値105の謎〜素点・偏差値から「妥当な評価軸」へ〜

2024年5月13日 16:51

こんにちは。ELPAの岡田健志です。

最近、私は地下鉄やバスに乗ることが多くなりました。移動の中でよく目にするのが塾・予備校の広告です。「偏差値○○からの大逆転」のようなフレーズは私が受験生の頃から人気のようで、バリエーションの差はありますが、いまだに散見されます。
「大逆転」って、みなさん、大好きなフレーズですね。

「偏差値」という表現で何を伝えたいのか？

このような広告に出会う時にいつも頭に浮かぶのは、

どのテストで？
どんな母集団で？
どの科目で？
そもそもその大逆転した生徒は何人で、全体の何%？

ということです。

ご存知だと思うのですが、偏差値というのは以下のように算出されます。

偏差値＝（得点-平均点）÷標準偏差×10+50

※このnoteでは、一般的な読者も想定して細かい話は割愛します。標準偏差という言葉は重要なのですが、ここでは分からなくてもOKです。

詳細は省きますが、偏差値はその母集団の平均点を偏差値50とした時に、その母集団内の得点分布の中でどのあたりに位置するかということを数値で示したものです。

言い換えれば、同じ得点（例えば100点満点で80点）をとったとしても、同じ母集団（例えば同じクラス）の生徒たちの平均点によって偏差値は変わってきます。

・クラスA：平均点90点
・クラスB：平均点30点

これは、同じテスト問題であっても、そのクラスの習熟度によって、平均点や点数の分布は変わってきます。

このクラスA・Bで、それぞれ80点を取った場合、クラスAでは偏差値40、クラスBでは偏差値65ということがありえます。

つまり、一緒にテストを受けた母集団の状況によって偏差値は変わります。

時々、予備校の模擬試験の合格目安の偏差値について、「予備校によって偏差値の数値が異なる」という話題がSNSなどで散見されます。

これは当然で、過去の生徒さんたち（受験生たち）の母集団が異なりますからね。

しかも、受験校によって科目の偏りや出題傾向まで異なるのですから、どの志望校にも通用する偏差値、ましてや社会一般で能力を証明する偏差値など存在しないのです。

東大生だけ集めてテストをしたら、およそ半数は偏差値50以下になるはずです

これは東大生が受験者の母集団になるとそうなるはずですよね。

それでも偏差値105のタレントをフォーカスする社会

そもそも「偏差値とはどのようなものか？」ということを冷静に調べてみればわかることなのですが、メディアも含めて「偏差値」という表現の誤用が多く行われることで、「誤用の慣用」が市民権を得ることがあります。

10年ほど前ですが、テレビで一時期「偏差値105」を謳い文句にした女性タレントさんがいました。

理論上、偏差値105はあり得ない数値ではありません。

問題は、この数値を見た時に、「どのようなテスト実施状況だったのか？」ということです。気になりませんか？

私なりにイメージしたの以下のような状況です。

・平均点が20点くらいの大規模テスト
・40点以上の受験者は考えられないくらい分布が下に固まっている
・その中で一人だけ満点をとる

そうすればその一人は偏差値が異様に高くなります。

この状況は、二つの点で重大なバグがあります。

（１）そもそもこのようないびつな分布になるようなテストは、受験者集団にとって「不適切なテスト」である。
（２）そのような受験者集団に一人だけ不適切な能力の人が入り込んでしまった。

例えるなら、ハイレベルな中学受験算数の問題を小学校低学年に受けさせて平均点を下げておいて、そこに難関中学合格者をテスト受験させるようなものでしょうか。

実際のそのタレントさんが人生において「偏差値105」という数値を叩き出したというエピソードを私は否定したいのではありません。ただ、そのことを「能力の証明」「アピールポイント」としてウリにしようとしたタレントさん・タレント事務所・テレビ番組に採用したテレビ番組制作者の方々が、一様にそれを「是」としたということに危惧を覚えます。誰も胡散臭さを感じなかったのでしょうか？　番組に関わる誰か一人でもファクトチェックしようとしなかったのでしょうか？

より危機的に感じるのは、最初の広告の例にあるように、教育業界の方々が同様のことをしているということです。

素点・得点だけの序列化の方がいいの？

「偏差値が母集団に影響される相対的な軸であることはわかった。
では、素点であれば揺るがないので、単純に点数で比べるだけでいいじゃないか。」

というご意見もあるでしょう。

ところが、それも配点の偏りによって簡単に点数が変わってしまいます。

例えば、AさんとBくんが同じ国語テストを受けたとします。
Aさんは「漢字」が得意で、Bくんは「文法」が得意だとします。
ある配点パターン（例：漢字問題1問2点・文法問題1問2点）では2人は同点です。
しかし、違う配点パターン（例：漢字問題1問5点・文法問題1問2点）であれば、Aさんの方がBさんよりも得点が高くなる。逆も同様です。
得点が変わると、順位も変わります。

こうなると配点の傾斜自体が恣意的な感じがしますよね。
配点が大きいということは、その領域の力が優れている人材が欲しいという出題者のメッセージではあるのですが、

テストの妥当性はもっと議論されるべき

そこで、このような恣意的なテストにならないように、テストの適切さを設計する学問があります。日本では「日本言語テスト学会」などもあります。（https://jlta2016.sakura.ne.jp）

テストや評価の専門家というのがいるのですね。ELPAでは、そのような専門家の方々と手を携えて、テスト開発・運営をしております。ご関心がありましたら、ELPAのサイトもご覧ください。