創造的な学びを促す「ワークショップ型研修」の効果をどのように測るか

2020年2月27日 23:53

本記事はCULTIBASEにも掲載しています。

人材育成や組織開発を目的として研修設計をする際、参加者にどのような変化を生み出したのか、いわゆる「学習効果」を示さなければ、プログラムの効果を評価することができません。

しかし、多様なスキル獲得を目的とした人材育成や複雑な組織開発のために取り入れられるワークショップデザインに基づいた研修（以下、ワークショップ型研修）は、従来型の研修に比べて「目標」や「評価ポイント」が多様なため、参加者は本当に学習をしたのか、教育としての効果はあったのか、という観点が示しにくいという側面も抱えています。

そこで、本記事では、以下の3つのステップで、ワークショップ型研修の評価の方法について考えていきたいと思います。

従来型の研修とワークショップデザインの違いを理解する

ワークショップ型研修の評価方法を考えるためには、まず従来型の研修とワークショップ型研修の違いについて理解しておく必要があります。両者の違いは以下の記事をご覧ください。

ざっくりと要約すれば、従来型の研修では、「インストラクショナルデザイン（ID）」とよばれる手法が主流で、この手法では学習目標が明確なため、よく設計された階段を登らせるように学習を促すことができます。

一方、固定観念を揺さぶる「ワークショップデザイン（WD）」に基づくワークショップ型研修では学習目標がゆるやかであり、学びは参加者に委ねられるという特徴があります。

ワークショップ型研修の参加者は、それぞれの学びの軌道を持つため、「この内容を理解した」「この行動ができるようになった」といった特定の知識の増加や行動変化だけで成果を測ることはできません。このことが、ワークショップ型研修の評価を困難にしている要因でもあります。

そのような中で、ワークショップ型研修はどのように評価できるのか、従来型の研修との比較を通じて考えていきたいと思います。

従来型の研修の評価方法

従来型の研修の評価方法として一般的によく用いられるのがカークパトリックの4段階評価です。1959年に開発され、日本でも海外でも広く用いられてきました。

レベル1は、研修直後に満足度を測るものです。参加者の主観によって評価されます。

レベル2は、研修直後にレポートや試験等によって学習到達度を判断するといった、第三者による客観的評価ができるものです。

レベル3は、研修終了後に日常業務の中で、研修の影響により行動変容が生まれているかを検証するものです。受講者へのヒアリングや、上司/部下へのヒアリング等により、評価を行います。

レベル4は、研修が業績にどのように影響したかを検証するものです。たとえば、生産性の増加/売上拡大/離職率の低下等、組織全体にもたらす価値が研修によって生まれたかを評価します。

レベル3やレベル4の評価が求められているものの、実際にはなかなかその評価までできていないことが指摘されており、その原因として「時間や人員などの資源不足」「組織からの管理サポートの不足」「評価に関する知識の不足」があるといったことが以下の論文で指摘されています。

https://onlinelibrary.wiley.com/doi/abs/10.1111/ijtd.12023

ワークショップ型研修の評価方法

さて、いよいよ本題のワークショップ型研修の評価方法についてです。この評価については、現状筆者の知る限りで体系的に示されたモデルはないと思いますが、カークパトリックの4段階評価のフレームワークはワークショップ型研修の評価においても十分援用可能だと思います。

しかし、ワークショップは学習者それぞれに気づきや学びが委ねられることからも、研修とは評価する中身が少し変わってきます。そこで、カークパトリックの4段階評価のレベル1~4に沿って、ワークショップの評価方法を考えていきたいと思います。

レベル1：満足度の評価

これは研修と同様に、ワークショップ終了後に満足度などをアンケートで参加者に尋ねる形で評価できます。ワークショップの特性として、遊びを取り入れたり、普段とは異なる眼差しで問いかけをすることによる非日常的な体験をすることに価値が置かれるため、その研修が「楽しかったかどうか」といった点を評価項目にいれることも大事だと思います。

レベル2：学習内容の評価

ワークショップは研修と異なり、明確に習得のステップがはっきりしているスキル・知識の獲得を目的としているわけではないため、「学習到達度」を測ることが主眼ではありません。しかし、「そのワークショップによって起こしたい学びを起こせたのかどうか」を計測することは重要です。

たとえば、「ルーブリックによる評価」と「パフォーマンス課題による評価」を用いることがあります。

A）ルーブリックによる評価

ルーブリックは、参加者に一律の到達度を求めるわけではないものの、参加者の学習を段階的に評価できる手法です。パフォーマンスの成功の度合いを示す尺度と、それぞれの尺度に見られるパフォーマンスの特徴を説明する記述語で構成される評価基準の記述形式のことを指します。

イメージとしては以下のようなもの。

左に評価基準となる項目を作成し、1~4の段階でこの項目の達成基準を定めます。

第三者による評価も可能ですが、ルーブリックは自己評価や学習者同士での評価に用いることができるため、自らパフォーマンスの改善にもつなげやすいという利点があります。

B）パフォーマンス課題による評価

一方で、パフォーマンス課題とは、様々な知識やスキルを総合して使いこなす（活用する）ことを求めるような複雑な課題のことです。回答者には、リアルな文脈の中で様々な知識やスキルを応用・総合し、課題を解いたり実践をしたりしてもらいます。回答はルーブリックによって測定します。

レベル3：行動変容の評価

こちらも研修と同じように、学習者自身へのインタビューや上司/部下などの他者インタビューを通じて評価をすることができますが、ワークショップは学習者全員が同じ行動の変化を起こすことを目的としているわけではないため、多様な行動を評価できるようにする必要があります。

ワークショップの実施前に、「ワークショップ終了後、こういう行動が生まれて欲しい」と様々な行動を想定しておくだけでなく、事前に予想していなかった変化も含めて多様な評価ができるとよいと思います。

また、ワークショップの前に、普段の行動についてヒアリングやアンケートをしてワークショップ前の行動を把握しておき、ワークショップ後しばらく経ってから再度アンケートやヒアリングを行うと、よりその変化を明らかにすることができるでしょう。

レベル4：業績貢献度の評価

組織開発や人材育成は、本来、それによる組織の業務パフォーマンスの向上などを目指して行われます。そのため、業務向上という観点での評価が求められることは当然とも言えます。

しかし、ワークショップが業務貢献につながったかについては、その他の要因による影響を必ずしも無視できないため、客観的なデータを示すことは困難です。（※これは研修も同様です）

因果関係を検証しようとする場合、たとえば、できるだけその他の条件を揃え、ワークショップを実施したチームと実施していないチームでをつくり、ワークショップ後数ヶ月にわたって業務パフォーマンスに違いがあるかどうかを検証する…といったことが必要になります。

とはいえ、実務的にこのような比較実験をするのはなかなか労力や時間も要するため、レベル4の評価を実務的に取り入れる方法については、引き続き探究が求められる領域ではないでしょうか。