筆記試験のエッセンス(人材選抜をする担当者が知っておくべきこと1)
人材選抜や採用・昇進の際には、通常、筆記試験をします。この時に、人材選抜を行う「あなた」が知っておくべきことをまとめました。今回もよろしくお願いします。(by Mr.モグ)
一般的に、筆記試験を大きく分けると、「多肢選択式試験」と「記述式試験」の二つに分けることができます。
さらに、「多肢選択式試験」は、問題形式によって、5肢(もしくは4肢や3肢)の中から正答を選ばせるものや、組合せ式、穴埋め式等、様々な問題パターンがあります。また、「記述式試験」では、論文形式で長文を書かせるものや、比較的短い文書やワードを書かせるものもあります。
ここでは、それらのうち多肢選択式の代表的なものを取りあげて解説していきます。
多肢選択式試験のメリットとデメリット
多肢選択式試験は、表のように記述式試験と比べるとメリットやデメリットが大きく異なります。
多肢選択式試験の場合は、マークシートなどにより解答するため、機械による短時間の採点が可能で、客観的な採点が出来ます。他方、(記述式試験と異なり)受験者は、(答えがわからなくても)選択肢の中から適当なものを選んで解答することで、得点を得ることが可能です。
ゲスとは何か?
一般的に、(答えがわからなくても)受験者が選択肢の中から適当なものを選んで解答することで、得点を得てしまうことをゲス(Gess)と呼び、このゲスを少なくすることが、選抜試験を実施する側にとっては重要になります。
例えば、四肢択一式試験の場合、「答え」が全くわからなくとも1/4(=0.25)の確率で、正答になる可能性がある訳です。このような偶然の正答率は、理論的には二項分布※ により求めることができます。
※各選択肢について×○の2 種類しか取り得ない(ベルヌーイ試行)ため、それを独立に n 回行ったときの確率は二項分布から算出できます。
受験者が全く分からなくても正解する確率をp(不正解となる確率は1-p)とし、n問中k回正答する確率は次の数式で求めることができます。
例として、四肢択一式で10題の出題があったときに、偶然に5問正解する確率は、
10C5×0.25⁵×0.75⁵=0.0584 (5.8%)となり、
次の表に示したように5問以上正解する確率は、(表の5問から10問の正答確率を足し合わせたもの 0.058+0.0162+0.0031+0.004=)0.0781(7.8%)になるのです。
特に多肢選択式試験は、出題した問題が難しすぎると、(「答え」のわからない)受験者は、適当な選択肢をランダムに選ぶ傾向が強くなるため、このようなゲスを少なくすることが、選抜試験の「信頼性」※ の向上につながることになります。(すなわち、難しい問題の場合は、その時の受験者の「運」により、偶然に正答になるケースが生じやすくなるのです)
※前回説明したように、その選抜試験が受験者の能力を正しく測定し、その誤差が少ない場合に、信頼性の高い試験ということになります。
どのような多肢選択式の問題が望ましいのか?
では、どのような多肢選択式の問題が、受験者の能力を的確に測定することができるのでしょうか?
例えば、次のグラフのように、五肢択一式試験で正答が選択肢1の場合、その正答の選択肢に多くの受験者の解答が集まり、他の選択肢に散らばるような解答パターンになることが好ましいのです。
しかし、下のグラフのように、正答の選択肢1以外の選択肢に、多くの受験者が(偏った)解答をした場合には、その問題が難しすぎたか、その問題の正答が(本当に)正しいかを再確認する必要が生じます。
逆に、選択肢1に多くの受験者の解答が集まり、他の選択肢を選択した受験者がほとんどいなかった場合は、問題が易しすぎたことになります。
(その場合は、この問題の他の選択肢は選抜に関しては有効に機能しなかったことになるので、問題の作り方として課題が残ることになります。)
そのため、先行研究では、如何に多肢選択式問題を作るべきかを研究しています。(例えばThomas M.Haladynaらの研究※があります)
※ A Review of Multiple-Choice Item-Writing Guidelines for Classroom Assessment、 Thomas M.Haladyna、Steven M.Downing、Michael C.Rodriguez、APPLIED MESUREMENT IN EDUCATION、2002
さらに、単に多肢選択式試験といっても、出題方法によって、難易度を調整することが可能であり、受験者のレベルに合わせた問題作成が出来るのです。
よく多肢選択式試験では、単なる知識しか問うことができない(思考力を確認することができない)といわれることがありますが、出題方法の工夫によって、思考力なども判定することが可能なのです。
知識や思考力に関する概念としては、アメリカの教育学者、ベンジャミン・ブルーム博士らが、「教育目標の分類学:認知領域」※ にまとめていますが、それによれば、「思考」には、6階層の思考スキル(知識→理解→応用→分析→総合→評価)があるとしています。
※ TAXONOMY OF EDUCATIONAL OBJECTIVES Handbook1:Cognitive Domain、B.S.Bloom、D.R.Krathwohl and B.Masia、1956具体的には、次のような段階になっています。
「知識」:(情報や概念を想起する、知る、暗記する)→
「理解」:(分かる、素材や観念を利用できる)→
「応用」:(情報や概念を特定の具体的な状況で使うことができる)→
「分析」:(情報や概念を各部分に分解し、相互の関係を明らかにするこ とができる)→
「総合」:(分析した部分を組み合わせて新たな物を生み出すことができる)→
「評価」:(素材や方法の価値を目的に照らして判断することができる)
このため、例えば、多肢選択式の問題についても、設問→「知識」→解答 といったように、知識を問う設問にすることもできますし、設問→「知識」→「理解」→解答 といったように、関連する知識の理解度を問う設問にすることもできます。
さらには、設問→「知識」→「理解」→「応用」「分析」→解答 といったように、関連する知識を理解していることを前提に、それらを応用・分析しないと解答に至らない設問にすることものできるのです。
参考までに、各段階における問題例(抜すい)を載せておきますが、このように、選択式試験の問題の出し方によって、受験者の思考レベルを判断することができます。
(「知識」レベルの問題)
単なる統計上の用語の知識(記憶)を求めているもの。
問1 個々の得点の総和を受験者数で割って得られた数値を統計学上何というか。
1.平均 2.中位数 3.並数 4.調和平均 5.平均偏差
(正答1)
(説明)
この問題では、単純に「平均」の定義を聞いているに過ぎない(知識の確認)
(「理解」レベルの問題)
統計用語の理解(定義)を確認するもの。
問2 算術平均の説明として正しいのはどれか。
1.得点全体の中心位置を表す数値。
2.得点順に並べたときの中央点を表す数値。
3.得点の広がりの程度を表す数値。
4.得点数の一番多い所を表す数値。
5.二つの変数間の関係の強さを表す数値。
(正答1)
(説明)
この問題では、「算術平均」の定義といった知識にとどまらず、具体的な意味や使い方を聞いている(理解の確認)
(「応用」レベルの問題)
統計用語の理解(定義)と実際の計算を組合せて、理解度を確認するもの
問3 受験者53人の得点の算術平均は52.0点であった。このうち82点、74点、50点の3人の受験者が失格となったとき、残りの受験者の算術平均として正しいのはどれか。
1. 51点 2. 54点 3. 58点 4. 62点 5. 65点 (正答1)
(説明)
この問題では、「算術平均」の定義や算出の仕方にとどまらず、具体的な数値を用いて、応用力を試す問題になっている(応用力の確認)
まとめ
このように多肢選択試験は、短期間での採点が可能であり、かつ客観的であるというメリットがある反面、「ゲス」が生じることにより、受験者の「真の能力」を測定する際の誤差が生じる可能性があるのです。
しかし、これについては、出題方法の工夫により回避できる可能性は高くなるのです。
さらに、多肢選択式問題も出題方法によって、単なる知識のみならず理解力応用力を測定することや、受験者のレベルに合わせた出題も可能なです。
選抜の目的によって、出題のレベルが異なりますが、一般的には、選抜が厳しくなるほど、知識よりも高い段階(理解・応用レベル)の問題が、(選抜に)効果的とされています。
いずれにせよ、選抜を行う担当者が、どこまで「多肢選択式問題」(の本質)を理解しているかにより、(単なる)表面的な試験になってしまうかもしれないし、受験者の「真の能力」を測定できる試験になるかもしれないのです。
年明けも毎日記事を書こうと思っていたのですが、今回は、思いのほか時間がかかり、結局夜の12時を過ぎてしまいました。(毎日配信ができなかった) 以後、もっと計画的にやらなくてはと、反省しきりです。今回も読んでいただきありがとうございました。(Mr.モグ)