【試し読み】コラム テキストマイニングの手法を用いて心理学研究の傾向を定量的に明らかにする(大塚幸生)
心理学研究の傾向とテキスト分析
昨今、SDGsという言葉は教育現場だけではなく、テレビやラジオ、インターネットなどでも取り上げられて耳にすることが多いと思います。SDGsは「Sustainable Development Goals」の略で、2015年に開催された国連サミットで採択された持続可能な開発目標になります。17の目標と169のターゲットから構成され、例えば「すべての人々への包摂的かつ公正な質の高い教育を提供し、生涯学習の機会を促進する」という目標では、「文化多様性と文化の持続可能な開発への貢献の理解の教育(一部抜粋)」が取り上げられています[注1−2]。最近では、人種問題、政治、科学など様々な分野でこの多様性という問題を認識することが大切になってきています[注3−4]。
心理学の分野では、心理学の研究知見は主に「西洋化された、教育を受けた、工業化された、豊かな、民主的な(ウィアードWEIRD:Western, Educated, Industrialized, Rich, and Democratic)」社会から選ばれた研究対象者に基づいていて、心理学の研究発表の多くもアメリカ合衆国に集中している点が10年以上前から議論されてきました[注5]。これまでの文化差研究では、欧米文化圏の人々と東アジア文化圏の人々では、自己概念や倫理道徳的な判断などの高次な認知だけでなく[注6−7]、基本的な視覚認知においても文化の影響を受けることが明らかになっています[注8−9]。したがって、研究者は自身の研究で観察された現象が世界中の人々にも見られるかどうか注意する必要があります[注10−12]。近年の文化差研究は、様々な地域からオンラインで研究対象者を大量に募集して調査や実験を行い、人間の行動における普遍性と多様性の両方を捉えることを試みています[注13]。
大学に設置されている心理学部あるいは心理学科には、知覚心理学、認知心理学、社会心理学、性格心理学、教育心理学、応用心理学、臨床心理学、発達心理学、神経心理学などを専門とした研究者がいます。おそらく世界中どの地域の大学でも、体系的に心理学の研究教育を行うことを目標としていますが、地域によって心理学の研究活動に特色があることは多くの研究者が暗黙的に認識していることと思います。例えば、心理士協会欧州連邦 European Federation of Psychologists’ Associations は、2017年の年次大会において、効果的な心理学的介入の組織化などの社会の課題に心理学が最大限取り組むよう呼びかけています。他方、北米地域では、心理科学協会 Psychonomic Society や科学的心理学会 Association for Psychological Science が知覚心理学や認知心理学などの基礎研究を中心とした年次会議を開催しています。これは、心理学の基礎研究は北米地域、応用・臨床研究はヨーロッパの地域が主流であるという研究活動の地域差を意味しているのかもしれません。
また、地域差だけでなく、研究活動の年代差もあるかもしれません。例えば、心理学の基礎研究は年代に関わらず比較的継続的に実施されている一方で、神経科学の研究は測定法の技術・解析法の発展によって、近年では研究の数が増加していると直感的には思うかもしれません。しかしながら、このような心理学研究に対する暗黙知を定量的に検証した研究はありません。心理学において研究・教育の活動を体系的に進めるためには、人間の行動の文化的な違いやWEIRDの問題を越えて心理学の研究活動そのものに普遍性・多様性が見られるかどうかを、客観的なデータ分析に基づいて定量的に検討する必要があると考えられます。
本稿では、心理学の研究活動が地域や年代を越えて普遍的であるのか、それとも多様な側面が見られるかどうかを検証した私の研究を紹介していきたいと思います。私の研究では、テキストマイニング(データ解析の技法を大量のテキストデータに適用することで何かしらの「知識」を取り出す技術)の一手法であるトピックモデルを用いて、心理学の研究に関連するトピックの出現確率が地域や出版年によって異なるかどうかを検討しました[注14]。なお、トピックモデルとは、多くのテキストデータに記載されている語句とその出現頻度から、トピック(テキストの話題、ジャンル、文体、著者といった特徴のカテゴリー)を推定し、大量のテキストデータを少数のトピックに還元することができる手法です。例えば、以下で紹介する私の研究では、多くの研究の抄録(論文タイトル、著者、研究概要などの研究論文に関する情報を端的にまとめたもの)をテキストデータとして用いてトピックモデルを実施し、研究活動の種類というトピックを推定しています。この際のトピックの推定の仕方(どのようなトピックがどの程度ありそうか)には、さまざまな方法があります。本稿で紹介する研究では、潜在ディリクレ配分法という推定法を使用しました[注15−16]。また、ロバーツらが開発した構造トピックモデルを実施することで、トピックの出現が地域や年などのメタ情報によってどのように変化しているのかを検討することができます[注17−18]。地域差や年代差を検討するにあたっては、この構造トピックモデルを実施しました。
……(続きはRe:mind Vol.1にてお読みいただけます)