非認知能力とGritは本当に有効か?
この記事は、慶應義塾・社会学研究科の開講科目「社会心理学特論 I :心理学方法論の新展開」での課題活動と、ReproducibiliTea Tokyo の活動の一環として、まとめられたものです。ReproducibiliTea は、信頼できる科学を目指す、国際的な草の根ジャーナルクラブ活動で、Tokyo は文字通り、その東京バージョンです。各記事の対象論文の選定ならびに記事内容には、執筆者を含む参加メンバー全員の意見が反映されています。記事についてのご質問・ご意見等は、repteatokyo@gmail.com までお送りください。
本記事は,Smithersらによる “A systematic review and meta-analysis of effects of early life non-cognitive skills on academic”とCredéらによる”Much Ado About Grit: A Meta-Analytic Synthesis of the Grit Literature”の内容と,それらを踏まえた議論をまとめたものになります。これまでのReproducibiliTea Tokyo の活動では、研究の再現性に関わる文献を読んできましたが、今回はやや脇道にそれ、最近話題になっている非認知能力とGritに関する文献を扱います。
非認知能力への注目
今から約40年前、経済学者のボウルズとギンタスは、人生の成功に影響を与える特性として、モチベーション・気質・忍耐力などを挙げ、それらをまとめて「非認知的個人特性(non-cognitive personality traits)」と呼びました(Bowles & Gintis, 1976)。非認知(non-cognitive)という表現からは、認知(cognitive)とは異なるものとして両者を区別しようとする意図が感じられます。彼らは、認知能力(知能やIQなど)が将来の経済的成功に重要であるというそれまでの考えに反論し、非認知的な特性が重要であると主張し、その後の研究に強い影響を与えました。現在では、非認知能力(non-cognitive skills)という表現が用いられるようになり、研究が広がっています。
では、なぜ、非認知能力はそこまでの注目を集めるに至ったのでしょうか?それは、幼少期の非認知スキルが短期的な影響のみならず、生涯にわたっての長期的な影響を持つと考えられたことにあります。ノーベル経済学賞を受賞したヘックマンは、ペリー・プレスクール・プロジェクト(Perry Preschool Study)の縦断研究の結果を例に、幼少期の非認知能力が将来の就職率や将来の年収などに影響すると主張しました(e.g., Heckman et al., 2013)。
しかし、ペリー・プレスクール・プロジェクトでは、非認知能力が実際に測定されていたわけではなく、あくまでも結果の解釈の段階で非認知能力の概念が使用されたにすぎません。また、これまでもReproducibiliTea Tokyo の活動で繰り返し確認してきた通り、単一の研究結果で確定的な知見に至ることは難しく、複数の研究結果を集めて判断する必要があります。そこで、非認知能力の早期介入に関する研究をレビューしたSmithersら(2018)の論文を読み、本当に長期的な影響力があるのかを検討することにしました。
非認知能力の早期介入効果
Smithersらはメタ分析という統計手法を使って、非認知能力に関する先行研究をレビューしています。メタ分析では特定のテーマに沿った先行研究を集め、各研究における効果の大きさを統計的に統合することで、そのテーマの平均的な効果の大きさや、今後期待できる効果の大きさを見積もることができます。
Smithersらが設定したテーマは、幼少期の非認知能力とその後の成果の関連です。非認知的スキルの具体例としては、下図の左側に示した15点が主な対象です。例えば、性格特性(Big-5)の1つである誠実性(Conscientiousness)や、実行機能に関連するものが対象となっています。一方、非認知能力が影響を及ぼす成果としては、学力(Academic achivement)、心理社会的成果(Psychsocial)、認知・言語力(Cognitive & Language)、身体的健康度(Physical health)が対象となっています。
これらのテーマに関する文献を検索してスクリーニングした結果、554の研究(介入研究50件、観察研究504件)が抽出されました。介入研究とは、ある時点で2つの集団の片方(実験群)に非認知能力を向上させる介入を行い、数年後にもう片方の集団(統制群)と成果指標を比較するような研究です。観察研究とは、ある時点で非認知能力の評価を行って高群と低群に群分けし、数年後に群間で成果指標を比較するような研究です。
Smithersらの研究ではさらに、抽出された研究の質の評価も行っていて、交絡因子が適切に統制されているのが全体の40%であり、残りの60%は交絡因子の統制に何かしらの問題があったことを指摘しています。また、研究の追跡期間の中央値が約1年程度であり、長期的な効果の検証はほとんど行われていないことを指摘しています。つまり、非認知能力の早期介入効果に関する研究の多くは、研究デザインに問題を抱えており、そもそも長期的な効果に関するエビデンスはほとんど無いのです。
前述のことを念頭に置きながらも、抽出された研究の中から質の高かった40%の研究に目を向けてみましょう。この研究のメタ分析の結果は多岐にわたるのですべてを紹介することはできませんが、重要な部分を要約して紹介します。メタ分析の結果、非認知能力の早期介入が将来の言語能力に及ぼす影響の予測区間は d =-0.13~0.79、数的能力に対しては d = -0.27~1.01という大きさでした。ここで d は効果量と呼ばれる指標であり、実験群と統制群でどれだけ差があったか(平均値差が標準偏差何個分に相当するか)を表します。この値が大きいほど、非認知能力の影響は強かったと判断できます。先ほど示した予測区間の範囲はとても広い値を示していました。これは、集めた研究の結果が一貫していなかったためです。つまり、非認知能力の早期介入は、高い効果を示した研究もあれば、低い効果しか示さなかった研究もあったということです。
ここまでのまとめ
非認知能力が広く注目を集めた背景には、幼少期の非認知能力が生涯にわたって長期的な影響力を持つのではないかという期待があったからでした。しかし、Smithersらの研究によれば、長期的な効果に関するエビデンスはほとんどなく、この分野の研究の多くは研究デザインに問題を抱えているのではないかということが指摘されていました。また、研究の知見は一貫しておらず、非認知能力の早期介入効果を検証するためには、適切にデザインされた長期の縦断研究を蓄積する必要がありそうです。
ところで、Smithersらのレビューには非認知能力として多様な構成概念が含まれていました。このような多様な概念を1つのメタ分析にまとめることには批判もあります(cf. リンゴとオレンジ問題)。そこで、次は非認知能力の中から1つだけGritという構成概念を取り出して、検討してみましょう。
Gritって何だろう?
Gritは近年特に注目されている非認知能力の1つです。Gritはダックワースによって提案された構成概念であり、「長期的な目標に対する忍耐と情熱」と定義されています(Duckworth et al., 2007)。下図の右側に示した質問項目のように、長期的な目標に対して粘り強く興味を持って取り組み続けることができるかの個人特性がGritであるとされています。Gritは忍耐(Perseverance)と一貫性(Consistency)という2つの一次因子(下位因子)の上に、Gritという二次因子(高次因子)が仮定されたモデルが想定されており(Duckworth & Quinn, 2009)、多くの研究が2つの因子を分けずに単一のGrit因子得点を計算しています。
Duckworth(2013)は、認知能力よりもGritの方が将来の成功を良く予測する因子であると語っています。このような主張はアメリカの教育に大きな影響を及ぼし、教育省の報告書にはGritが有望であると強調され(SRI International, 2018)、多くの学区がGritの育成に動き出しています(Cohen, 2015)。日本でも、Gritは「やり抜く力」と訳され(中室,2015)、いくつかの市区町村でその育成が目標に掲げられています(e.g., さいたま市)。
では、本当にGritは学業成績を予測する因子となっているのでしょうか?このテーマについてメタ分析を行ったCredéらの研究を見ていきましょう。
Gritの効果
Credéらが設定したテーマは、Gritと学業成績の関連です。ここでの学業成績とは主に高校や大学でのGPAを指します。文献検索とスクリーニングの結果、最終的に73の研究がメタ分析の対象となりました。これらの研究に含まれるサンプルサイズの合計はN=66807であり、単一の研究よりも信頼性の高い結論を導き出すことができます。
メタ分析の結果、Grit全体と学業成績の相関は ρs=.08~.18と低い値でした。この結果から、Grit全体と学業成績の関連は弱いと判断することができます。下位因子ごとに見ても、忍耐との相関は ρs=.25~.29、一貫性との相関は ρs=.09~.13という値にとどまります。
先ほど示した相関は、下位因子間で大きさが異なりました。これまでの研究でGritは1つの高次因子にまとめられてきましたが、学業成績との関連に違いがあるなら、分けて扱うべきではないでしょうか?その他にも、CredéらはGritの構成概念妥当性について疑問を投げかけています。非認知能力の中にはGritに類似した構成概念が多数あり、それらの概念と識別できるのか疑問です。特に、性格特性(Big-5)の1つである誠実性(Conscientiousness)とGritにはこれまで先行研究において非常に高い相関が指摘されていて、2つの概念はほとんど同じなのではないかという疑問が持たれているわけです。2つの尺度は、質問項目レベルで見ても似通った項目が見られます。
この疑問について、Credéらは階層的重回帰分析(Hierarchical Multiple Regression)という 手法を使った検討を行っています。具体的には、学業成績を予測する際に、誠実性を統制しても、Gritの下位因子の効果は残るのかを検討しています。その結果、一貫性の因子が学業成績の説明・予測にほとんど寄与しない一方で、忍耐の因子はわずかながら説明・予測に寄与することが示されました。よって、一貫性は誠実性とほぼ変わらない因子であり、誠実性と異なる成分を持っている忍耐の因子がより重要なのかもしれません。
同様の結果はRimfeldらによる別のメタ分析でも確かめられています(Rimfeld et al., 2016)。Rimfeldらの分析によれば、学業成績の分散に対して性格特性(Big-5)が5.5%を説明していて、Gritによる追加の説明分は0.5%しか見られませんでした。また、学業成績と関連が見られたのは忍耐の因子であり、一貫性は関連が見られませんでした。加えて、RimfeldらはGritは家庭の方針といった環境で変化するどうかについても検討を行っていて、そのような証拠はないと結論付けています。
これらの研究をまとめると、Gritのうち学業成績に関連するのは忍耐の因子だが、性格特性以上に学業成績を説明・予測する部分は非常に小さいと結論付けることができます。また、そもそもGritが育成可能か(介入によって変化するのか)という点についてもさらなる研究が必要だと言えます。
追加の議論と感想
ここまで、非認知能力とGritに関するレビュー論文を見てきました。2つの研究で共通して指摘されていたのは、1.類似概念との識別性の問題と、2.エビデンスが不足している問題でした。最後にこの2つの問題について、追加の議論と感想を書きたいと思います。
1.ジャングル誤謬
2つの同一のもの(あるいは、ほぼ同じもの)を異なるものとして取り違える誤りをジャングル誤謬といいます。同じような構成概念を測定する尺度が異なるものとして存在した場合、統合したり、より有効な片方をのみを採用しなければいけません。では、非認知能力に分類される構成概念についてはどうでしょうか。本記事ではこれまでにGritと誠実性(Conscientiousness)の類似を紹介してきました。非認知能力のその他の構成概念についても引き続きジャングル誤謬に陥っていないか検討を行う必要があると考えられます。ジャングル誤謬に陥ることは研究の発展阻害や研究リソースの浪費という観点からも問題があります。
非認知能力に限らず、教育・心理学分野では毎年のように尺度開発論文が公表され、構成概念が乱立している状態にあります。このような状態を踏まえ、ジャングル誤謬を防ぐにはどのような取り組みが必要でしょうか?
第一に、仲嶺・上條(2019)の指摘する通り、新しい尺度開発研究では構成概念を明確化し、既存の構成概念や尺度との違いを明確にするよう求めていく必要があるでしょう。仲嶺・上條(2019)によれば、2001~2016年に「心理学研究」に掲載された尺度作成論文は計129件でしたが、新しい構成概念と既存の構成概念との間の類似点や相違点(弁別的必要性)を記載していたのは全体の約3割にとどまりました。このような現状の問題を正しく認識し、安易な尺度開発を行うことに慎重なる必要があります。
第二に、Hussey & Hughes(2020)の指摘する通り、構成概念妥当性をより丁寧に検証していく必要があるでしょう。Hussey & Hughes(2020)によれば、内部一貫性のみならず、再検査信頼性、因子構造、年齢・性別群の測定の不変性などを検討した場合、尺度が有効だと判断できる割合は大きく減少することを指摘しています。言い換えれば、これらの要素を検証しない研究者の自由度は、尺度の妥当性判断を歪めるものであり、Hussey & Hughes(2020)はこのような不正を妥当性ハッキング(v-hacking)と呼んでいます。v-hackingを防ぐためには、妥当性検証の手続き(e.g., Boateng et al., 2018; Flake & Fried, 2019)などを参考に、妥当性の検証計画の事前登録(pre-registration)を行うことが必要かもしれません。
2.エビデンスの不足した教育政策の犠牲者
非認知能力とGritのどちらのレビュー論文においても、教育政策として採用するにはエビデンスが不足していることが指摘されていました。しかし、このようなエビデンス不足の状態にもかかわらず、現実の教育政策として採用されたり(e.g., SRI International, 2018)、公教育(e.g., 埼玉県)や私教育(e.g., Grit School)の様々な場面で実際に多くの子供たちに影響を及ぼしたりしています。効果がはっきりしない教育政策や教育介入は、有効性が確かめられている教育を受ける機会を子供たちから奪い、教育リソースを無駄に浪費します。子供の将来の成功を願って始められたはずの研究が、子供の教育に悪影響を及ぼしている可能性すらあるのです。また、このような教育政策には税金や公的資金が投入されており、誰もが無関係ではいられません(例えば、前述の埼玉県では非認知能力を測定する学力調査に年間2億円を投じている)。
では、なぜエビデンスが不足している研究が教育政策に採用されるのでしょうか?そのような事態を防ぐにはどうしたらよいのでしょうか?どちらもカギを握るのは研究者のあり方だと私は考えます。研究成果が教育政策として導入される背後には、多くの場合、その政策の提案や裏付けを行う研究者がいます。その研究者自身が個別の研究の限界や一般化可能性を認識していたとしても、行政機関にそれが正しく伝わるとは限りません。研究成果が正しく伝わり、過度の一般化が起きないようコミュニケーションに努めることは、研究者の社会的責任なのではないでしょうか。
謝辞
この記事の草稿に有益なコメントをくださった、平石界先生・池田功毅さんとその他の方々に感謝します。
Reference
Boateng, G. O., Neilands, T. B., Frongillo, E. A., Melgar-Quiñonez, H. R., & Young, S. L. (2018). Best Practices for Developing and Validating Scales for Health, Social, and Behavioral Research: A Primer. Frontiers in public health, 6, 149. https://doi.org/10.3389/fpubh.2018.00149
Bowles, S., & Gintis, H. (1976). Schooling in capitalist America: Educational reform and the contradictions of economic life. New York, NY: Basic Books. (宇沢弘文訳『アメリカ資本主義と学校教育1, 2』岩波現代選書 1986-1987年)
Cohen, R. M. (2015). Will students soon be tested for “grit”? The American Prospect. https://prospect.org/education/will-students-soon-tested-grit-d2/
Credé, M., Tynan, M. C., & Harms, P. D. (2017). Much ado about grit: A meta-analytic synthesis of the grit literature. Journal of Personality and Social Psychology, 113(3), 492–511. https://doi.org/10.1037/pspp0000102
Duckworth, A. L. (2013). The key to success? Grit. https://www.ted.com/talks/angela_lee_duckworth_the_key_to_success_grit?languageen#t-9644
Duckworth, A. L., Peterson, C., Matthews, M. D., & Kelly, D. R. (2007). Grit: Perseverance and passion for long term goals. Journal of Personality and Social Psychology, 92, 1087–1101. http://dx.doi.org/10.1037/0022-3514.92.6.1087
Duckworth, A. L., & Quinn, P. D. (2009). Development and validation of the short grit scale (Grit-S). Journal of Personality Assessment, 91, 166–174. http://dx.doi.org/10.1080/00223890802634290
Flake, J. K., & Fried, E. I. (2019, January 17). Measurement Schmeasurement: Questionable Measurement Practices and How to Avoid Them. https://doi.org/10.31234/osf.io/hs7wm
Heckman, J. J., Humphries, J. E., & Kautz, T. (Eds.). (2014). The Myth of Achievement Tests: The GED and the Role of Character in American Life.
Heckman, J., Pinto, R., & Savelyev, P. (2013). Understanding the Mechanisms Through Which an Influential Early Childhood Program Boosted Adult Outcomes. The American economic review, 103(6), 2052–2086. https://doi.org/10.1257/aer.103.6.2052
Hussey, I., & Hughes, S. (2020). Hidden Invalidity Among 15 Commonly Used Measures in Social and Personality Psychology. Advances in Methods and Practices in Psychological Science, 3(2), 166–184. https://doi.org/10.1177/2515245919882903
仲嶺真・上條菜美子 (2019). 「心理学研究」の新心理尺度作成論文に記載された尺度作成の必要性 心理学研究, 90(2), 147-155. https://doi.org/10.4992/jjpsy.90.17233
中室牧子 (2015). 「学力」の経済学,ディスカヴァー・トゥエンティワン.
Poropat, A. E. (2014) Other-rated personality and academic performance: Evidence and implications, Learning and Individual Differences, 34, 24-32.
Rimfeld, K., Kovas, Y., Dale, P. S., & Plomin, R. (2016). True grit and genetics: Predicting academic achievement from personality. Journal of Personality and Social Psychology, 111(5), 780-789. http://dx.doi.org/10.1037/pspp0000089
Smithers, L.G., Sawyer, A.C.P., Chittleborough, C.R. et al. (2018). A systematic review and meta-analysis of effects of early life non-cognitive skills on academic, psychosocial, cognitive and health outcomes. Nature Human Behaviour, 2, 867–880. https://doi.org/10.1038/s41562-018-0461-x
SRI International (2018). Promoting Grit, Tenacity, and Perseverance: Critical Factors for Success in the 21st Century. SRI International, Menlo Park, CA. https://www.sri.com/work/publications/promoting-grit-tenacity-and-perseverance-critical-factors-success-21st-century
この記事が気に入ったらサポートをしてみませんか?