教育評価と教育測定
教育評価について考えている。
一般的に、学校教育における評価という言葉は「テスト」とか「通知表」などと結びつけられがちである。しかし、本当はもっと広い文脈で語られなければならない。
教育評価の語源は「エバリュエーション」であり、この言葉には「評価は授業改善に活かされるべき」という意味合いが含まれている。つまり、仮にテストをしたとして、児童の点数が芳しくない場合は、児童の出来が悪いわけでは決してなくて、悪いのは「教師の教え方」や「教材の質」、「単元の配列」などであり、それらは絶えざるテストによって効果が検証され続けなければならない、ということである。
一方、教育測定という言葉もある。こちらの語源は「メジャメント」である。どうも日本に「教育評価」という概念が伝わったとき、「メジャメント」の概念を中心に学んでいた教育心理学派の方々が中心になって伝えていたらしく、そこで「教育測定」と「教育評価」という言葉がごちゃ混ぜになってしまったのではないかと、いうことらしい。
実際、日本人にとっては「教育評価」は「エバリュエーション」よりは「メジャメント」の方が馴染みやすかったらしい。その証拠として、日本独自の受験指標である「偏差値」というのが、良くも悪くも人口に膾炙されている。この偏差値は、東京の公立中学校の理科教師である桑田昭三氏によって発明されたものである。その経緯などは以下のサイトに詳しく載っている。
https://hosted.jalt.org/test/PDF/Kuwata-j.pdf
確かに、戦後の「国家一丸となって戦後復興から経済発展を遂げる」というミッションを達成するためには、この偏差値という制度は役に立った。全国の学生を同一のモノサシで測って序列を付ければ「ある種の能力(ここでは学力)」を測定することには容易である。そして、全員を同じ競争に参加させれば、分母は大きくなるので、そのピラミッドはどんどん高くなる。
歴史を振り返れば、明治の始めの欧米列強に追いつき追い越せの時もそうであったように、日本における近代公教育の役割は「教育」よりも「選抜」の方が大きかったのかもしれない。「国家須要の人材を育成する」ためには、高いレベルの読み書き算数ができて、様々な科目を学び続ける忍耐力や、教師や先輩や上司に従順になれる素質などを鍛えていかなければならなかったのだろう。
いつだって財政難である教育行政は、その素質をもつ子どもたちを選抜して、優先的に教育をしていかなければならなかった。そして気がつけば、日本の高度経済成長は達成され、日本は経済大国になり、ジャパンアズナンバーワンと呼ばれ、バブルが弾けて、今に至る。
現在の大学進学率は6割に迫るが(2023年57.7%)、研究者によれば、どうもこの辺りが青天井らしい。高校全入運動というのは、保護者の熱い思いから達成されたものではあるが、大学全入運動というのは、おそらく起きないであろう。もう全国の学生が「国家一丸となって」というムーブメントは、多様性を尊重するこの時代にはそぐわない。
では、価値観が多様な今の時代における学校教育における教育評価のあるべき形とはどのようなものであろうか。
それは、冒頭の話に戻るが、今こそ「エバリュエーション」を教育評価に取り戻すということなのか。ここに関して、教育評価界隈の人たちの鼻息は荒い。
2001年の学習指導要領改定は「生きる力」の育成を大々的に掲げたが、その後の2003年の「PISAショック」による学力低迷の責任を負わされ、この「生きる力」は「確かな学力」という看板に代わってしまった(今も「生きる力」の看板は細々と残っているが)。
しかし、教育評価界隈に言わせれば、2001年の改定には別の重大な意味がある。それは「評定」欄における相対評価をやめて、「目標に準拠した観点別の評価」を基本とすることになった、記念碑的な改定なのである。
教育評価の研究者にとって、これは悲願の達成であったようだ。先述の通り、教育評価の本来の語源は「エバリュエーション」であり、それがひょんなことから「メジャメント(教育測定)」と融合してしまい、その後「教育測定」のような意味で「教育評価」が認識されてしまっていた。
戦前の「主観的な評価」からの脱却をねらい導入された「相対評価」は、その後「偏差値」を生み出し、以後、教育評価が測るものは「子どもたちの成長」から「集団の位置付け」に様変わりしてしまった。そうやって多くの子どもや保護者を傷つけてきた教育評価は、戦後から半世紀を経て、学校における「嫌われ者」になってしまった。
「教育評価」を教育評価研究の大家である田中耕治は苦々しく以下のように述べている。
おそらく、田中は長い間、教育評価を研究する中で、いつも悔しかったに違いない。この引用をした書籍「教育評価」は、まさに教育評価を一望俯瞰でき、田中の渾身の一作であることは疑い得ない良書であるが、その冒頭にこれを書いてしまうあたりその苦悩は切実に伝わってくる。
さて、しかしそれも2001年を機に大逆転、といきたい所であったが、その前途はまだ困難であった。
子どもたちの「集団の位置づけ」を「格付け」することは、とても容易である。テストをして、点数を元に序列化したら良い。
しかし、子どもたち「それぞれの学び」を「それぞれに評価する」ということは、とても困難である。そして、その困難さに向き合えるほど、学校現場には余裕がなかった。
鳴物入りで導入された「目標に準拠した評価」であったが、これはその達成の複雑さや困難さにより、その想定された運用ではなくて、形式的な運用になってしまった。
例えば「関心・意欲・態度」の評価をする際に「授業中の挙手の回数」や「ノート提出状況」を参考にする教師が激増した。これを国の機関は「関心・意欲・態度」の評価としては不適切であるとしている。
しかし、教師を単純に責めることはできないであろう。なぜなら、評価には「客観性」が必要であるとされ、「保護者の開示請求に堪えるもの」という条件も暗黙のうちにあった。そうなると、このように「量的に測定が可能」な指標でないと「適切な評価」ではないのではないかと、現場の教師たちも考えたのであろう。
そもそも「関心・意欲・態度(現在は「主体的に学習に取り組む態度」)」のようなものを、「客観的に」かつ「量的に測定できる」ような指標は存在しない。というか、「子どもの内面を評価」というあたりに危険な要素を感じ取る方も多いのではないだろうか。
もちろん、そのような批判に答えるために国立教育政策研究所は「主体的に学習に取り組む態度」の評価指標として「粘り強さ」や「学習を調整する力」などを挙げているが、これでもまだ物足りないと感じるのは筆者だけではなかろう。そんなものは「評価しようがない」のである。
さあ、そろそろ紙幅が尽きてきた(いつも3000字を目安にしている)。
今回は教育評価についての概観を述べてみた。まだまだ課題の多い教育評価ではあるし、筆者の立場としては「教育評価の全廃」もしくは「児童への非開示」である。なくてもいいし、あったとしても「教育の邪魔にならない」ようにしてほしい。
現在の学校現場における教育評価は、まさに「評価のための評価」である。「評価しろ」としつこく言われているから、とりあえず教育活動の時間を削って評価をしているというのが現場の実感である。
そんなものはエバリュエーションでもなんでもない。メジャメントではなくなったかもしれないが、教育の質を悪化させているという点で、決してエバリュエーションではないのだ。
我々は人間であり、資源と時間は有限である。教育評価には、ぜひご退場願って、その空いた余白には何も詰めないで、教師の忙しさを緩和してあげてほしい、という話はまた別の機会にさせてもらうとする。