見出し画像

リッカート尺度の原論文を読む

リッカート尺度とは、アンケート調査でよく使われている回答尺度です。
これは1932年のレンシス・リッカートの論文に由来しているのですが、一体その論文には何が書かれているのでしょうか?

こんにちは、Aska Intelligenceの川本です。
今回は有名なリッカート尺度について、その原論文(の一部)をざっくり読み解いていこうと思います。

そもそもリッカート尺度のリッカートは人の名前だということをご存知だったでしょうか。アルファベットでの綴りがLikertなので、「ライカート」と発音してしまう人が多いらしいですが、読み方はリッカートです。

リッカート尺度自体についてのお話は別の記事にも書きましたので、興味ある方はご覧ください。

実は原論文がある

結構簡単な尺度でもあるので、原論文があるということを知っている人も少ないのではないかと思います。それを読んだことがある人はもっと少ないでしょう。

実は、この論文は「リッカート尺度を提案します」という内容の論文ではありません

リッカートの原論文は現在パブリックドメインでウェブに画像ファイルとして公開されています。主に前半部分だけですが、電子化した原稿を置いておいたので、よかったら見てみてください。ChatGPT-4oで和訳したものも置いてあります。

ちなみに、20世紀初頭の論文ということもあってかなり差別的な内容(主に黒人差別)も含まれています。翻訳しているとChatGPTで警告が出てきます。ただ、論文の内容を変えるわけにもいかないので、一応そのまま翻訳されたものを載せています。

どんな論文なのか

さて、中身に入っていきましょう。
順を追って読み進めないと理解できないので、順番に説明していきます。

位置付け

タイトルは、"A Technique for the Measurement of Attitudes"(態度の測定技術)です。
その名の通り、「人々の態度はどれくらい正確に測定できるのか」というのが論文のテーマです。

この論文は、レンシス・リッカートの学位論文(を基に出版された論文)のようで、指導教員はガードナー・マーフィーという人です。

本研究は、1929年にガードナー・マーフィーによって開始された大規模な調査の一部ですが、主に社会的態度の研究における量的側面に関連して生じた技術的問題の解決を目的としています。

レンシス・リッカート "A Technique for the Measurement of Attitudes," (1932) の和訳

すでにこの時代には人々の「態度」というものをどう測定するかという研究はあり、主にこの論文では先行研究としてサーストン尺度を挙げており、これとの比較を主軸としています。
(サーストン尺度は歴史的な知名度はあるようですが、現代ではあまり使われていない尺度です。)

「態度」の定義と測定

そもそも人々の「態度」ってどうやって定義し、どうやって測れば良いんでしょう、ということが議論されています。

少し長いですが引用します。

社会心理学者が態度を特定の状況における特定の反応への傾向として定義するならば、ある特定の時点で特定の人に存在する定義可能な態度の数は、その人が受ける刺激の範囲に依存することは明らかです。しかし、刺激をほぼあらゆる考えられる方法でグループ化し、無限に分類および細分類することが可能であるため、特定の人が持つ態度の数はほぼ無限であるということは厳密には真実です。この結果は統計的にも心理学的にも不条理です。同様に不条理であり、研究への障害となるのは、態度を単に言語表現として、または特定の言語表現に対する賛成または反対の表示として考える定義です。可能な言語の組み合わせの数は無限であり、したがって態度の数も同様に無限であるべきです。したがって、上記の二つの方法で態度を定義した人々は、実際には自分が言ったことを正確に意味していなかったことは明らかです。彼らは実際には、明確に識別可能な外向きの行動傾向や言語反応パターンではなく、特定の識別可能な社会的反応のグループを示そうとしていました。各グループ内では、さまざまな反応のファミリー的類似性が想定され、各態度のグループは他のすべてのグループから区別可能な違いを示すとされています。分析を十分に進めると、これは態度が単位として扱われるのに十分にコンパクトで安定した習慣であることを意味することがわかります。もちろん、特定の「態度」の領域内での個々の反応の変動、および各態度と次の態度の違いが関与していることが認識されるでしょう。私がデンプンの摂取を食事的な怪物と見なす「態度」を持っているならば、そのような食品に対する先天的な嫌悪、またはパン、ジャガイモ、米などに向けられた一連の後天的傾向が存在すると想定される必要があります。したがって、態度を生得的なものとしても学習されたものとしても、いずれの場合も、それは人格の中で硬直的で不変な要素(事実上、そのような要素が存在する場合)がなく、むしろ反応が動く範囲であることがわかります。

この基礎に立って、我々の重要な問題の一つは、社会的態度がこの意味で測定可能であることを示すことができるかどうかを見つけることです。そして肯定的な答えが得られた場合、ある態度を他の態度から分離することを正当化するために真剣な試みを行わなければなりません。というのも、もし態度の間にファミリー的な違いがないのであれば、単に一つの無限の態度の連続が存在することになるからです。この基礎に基づいて態度を測定することは、存在するある傾向の量を決定する以上の意味を持つことは決してなく、その傾向が実際に何であるかを定義することはできません。

レンシス・リッカート "A Technique for the Measurement of Attitudes," (1932) の和訳

ざっくりまとめ直すとこんな感じかと思います。

  • 「態度」を何らかの社会的な反応として定義したい。

  • しかし「態度」を"行動傾向"とか"言語表現"で細かく定義してしまうと、様々な詳細で結果が揺らいでしまうので、適切ではない。

  • 何らかの測定可能な「態度」(=反応)から、その傾向グループ(ファミリーもしくはクラスター)を見出したい。

測定自体としては、"行動傾向"とか"言語表現"に頼らざるを得ないと思いますが、それが曖昧なものであることをよく念頭に置きましょうというのがポイントです。もしかしたら「態度のグループ」など存在しないかもしれないということも考慮に入れているところは思慮深いですね。

日本人や親日/反日の例

これは余談ですが、ちょいちょい日本人や親日/反日の話も例として出てきます。

一般的に言えば、態度は「クラスター化」または連結していると考えられます。例えば、一般的な親日的態度は、一連の親日的な言語宣言や一連の親日的な明白な行動に表れるかもしれません。統計学的には、グループ要因が初めから仮定されています。

レンシス・リッカート "A Technique for the Measurement of Attitudes," (1932) の和訳

… 例えば:「南カリフォルニアの日本人トラックファーマーのグループは、その勤勉さと低い生活水準のおかげで、アメリカの競争相手よりも安く販売することができます。アメリカの農民は、『すべての白人は白人農家からのみ購入する義務がある』と主張しています。」この最後の形式の質問は、上記の五つの反応(強く賛成する、賛成する、未決定、反対する、強く反対する)を使用します。

レンシス・リッカート "A Technique for the Measurement of Attitudes," (1932) の和訳

問題意識

ということで、リッカートの論文の主眼は、「態度」は何らかのグループとして特徴づけられるのかという点にあります。

繰り返しますが、「リッカート尺度を提案します」という内容の論文ではありません。

全体的な特異性-一般性論争から生じた統計的混乱を解消し、これらの競合する心理学者グループを分ける実際の不一致点を明らかにし、すべてのそのような推論方法に関与する統計的仮定を明確にし、何よりも多様な公共問題に関する態度の実際の一貫性やクラスターを広範囲にわたって経験的にテストする時期が来たように思われます。

レンシス・リッカート "A Technique for the Measurement of Attitudes," (1932) の和訳

特異性-一般性論争(specificity-generality problem)が正確に何なのかはもう少し古い文献を掘り進めないと分からないですが、ざっくり言うと、人々の態度グループはどんな特徴を持っているのかという問題かと思います。そして、態度研究に関して当時色んな人が色んなことを主張して混乱状態にあった様子が伺えます。
そろそろこれをなんとかしましょうよ、という話です。

調査・分析内容

大枠として何をしたい論文なのかは前節までで説明しました。
この後は、この研究で実際に行われた調査について簡単に触れていこうと思います。

もちろん、ここでの調査方法ではリッカート尺度が登場します。
そうじゃなければこの論文に由来してリッカート尺度という名前が付いていませんから。

20世紀初頭に、どんな感じで調査が行われていたかが垣間見れるのは興味深いです。
III. 手順(Procedure)の章の冒頭を引用します。

1929年にガードナー・マーフィーと本研究者によって考案されたこのプロジェクトは、まず第一に、次の5つの主要な「態度領域」に関連する多岐にわたる問題を提示することを目指しました。国際関係、人種関係、経済対立、政治対立、そして宗教です。アンケートで最もよくカバーされた態度領域は、人種関係、国際関係、および経済対立でした。私たちは、アンケートで使用された要素の間に非常に高い特異性が存在すると確信していました。同じ問題を明確に扱っている質問を除いてです。例えば、C.W.ハンター(15)によって得られた結果に基づいて、黒人と白人の関係において、分離に対する態度、黒人と一緒に食事をすることに対する態度、およびリンチに対する態度が独立しており、一般的に黒人に対する特定の態度が他の問題に対する態度と明確な関係を持たないと信じられていました。もちろん、これは、ある項目での親黒人態度を他の項目での親黒人態度と比較する際に、スプリットハーフ法による信頼性がゼロになるという理想的な特異性を得ることを期待していたわけではありません。

レンシス・リッカート "A Technique for the Measurement of Attitudes," (1932) の和訳

さらっと差別的な内容が触れられていますね。

詳しい方はご存知かと思いますが、ここで「スプリットハーフ法による信頼性」とは、アンケート調査の回答が連関しているかを測る方法やその指標のことです。当時すでにスピアマン-ブラウン公式(1910年)が知られているので、これで信頼性が測れます。
ここの文脈でいうと、「一般的に黒人に対する特定の態度が他の問題に対する態度と明確な関係を持たない」が統計的に有意かを判定できます。

スピアマン-ブラウン公式についても面白い逸話があるので、興味がある方はリンク先のWikipediaを読んでみてください。

アンケート設計

アンケートの作成方法は次の通りです。典型的なアメリカの大学の多くの学生の間で、国際的、異人種的および経済的態度、そしてわずかに政治的および宗教的態度を集中的に研究することを決定し、他の心理学者によってこれらの目的で既に実施されているアンケートを調査しました。特に有益であることが判明したのは、G.B.ニューマン(23)、C.W.ハンター(15)、R.W.ジョージ(9)のアンケートでした。さらに、1929年の秋に約200の新聞や雑誌を迅速に調査し、意見の宣言を考慮するために選び出し、特に社説で頻繁に見られるより教条的な意見に特別な重点を置きました。少数の質問は書籍、演説およびパンフレットから含まれ、いくつかは実験者によって作成されました。以前に広範囲に試されたアンケート素材を使用できる場合や、ある意味で「基準」が利用可能な場合には、質問をそのまま使用することを好みました。いくつかのケースでは、一つの問題だけが関与し、曖昧さを避けるために、質問を簡略化し、簡単にする必要がありました。自分たちで質問を作成した場合には、簡潔さ、明瞭さ、および簡潔さを強調するよう努めました。

レンシス・リッカート "A Technique for the Measurement of Attitudes," (1932) の和訳

気合が入っていますね…!

聞き方についての検討も興味深いものがあります。
これは現代でも参考になる知見だと思いますが、私は最近の文献で触れられているのを見た記憶がないので、引用しておきます。

例外なく、質問は「事実の判断」ではなく「価値の判断」を許す形式で提示されました。「アメリカは〜すべきである」とか、「我々は〜すべきである」とか、「誰も〜を許されるべきではない」などのフレーズが頻繁に繰り返されました。いくつかの質問は一見すると事実に関するもののように見えるかもしれませんが、より詳細に分析すると、そのような「事実」が非常に恣意的な性格を持つことが明らかになります。使用された質問の中で最も望ましくないものは次のようなものでした:「戦争は現在、生物学的に必要不可欠であるか?」このような質問は、多くの人にとって事実に関する質問のように思われます。例えば、ネオ・マルサス主義の観点からは、この質問には肯定的な答えしかないと見なされるかもしれません。しかし、「必要性」という用語は、物理学者や論理学者が議論するようなタイプの必要性ではなく、むしろ学生のさまざまな欲望に対する態度を指します。

レンシス・リッカート "A Technique for the Measurement of Attitudes," (1932) の和訳

回答者パネル

教員との協力を通じて、態度テストはイリノイ州からコネチカット州、オハイオ州とペンシルバニア州からバージニア州に至る九つの大学およびカレッジの学部生(主に男性)に実施されました。(ここでは適切ではないため、機関名は印刷できませんが、コロンビア大学データ(グループD)のみが識別されています)。参加者総数は約2000人を超えましたが、ここで集中的に分析されたデータは650人*から得られたものです。この態度テストは、「意見調査」と呼ばれ、最初は1929年の晩秋に実施され(グループCおよびグループFは1931年に実施)、教員との取り決めにより30日後に再テストが行われました。再テストには、最初のテストのいくつかの項目と多くの新しい項目が含まれていました。最初のテストには平均約40分、再テストにはそれよりわずかに長い時間がかかりました。

レンシス・リッカート "A Technique for the Measurement of Attitudes," (1932) の和訳

具体的な質問・回答項目や結果については割愛します。

さいごに

いかがだったでしょうか。

リッカートの論文は思慮に富んでおり、調査自体もかなり綿密に練られていると感じます。ただ研究結果の内容自体については、現代に生きる我々にとって深く踏み込む価値があるのかは謎だと思いましたので、触れませんでした。というか、私自身あまりちゃんと読んでいません。
分析方法についての歴史を読み解く味わいはあるかもしれません。

お察しかと思いますが、「スプリットハーフ法による信頼性を測る」という営みが確立しているということは、1932年の時点ですでに選択式アンケート回答はたくさんやられており、リッカート尺度のような調査データも色んなところで収集されているはずです。一方で、本記事では触れていませんが、論文では従来法より簡単に態度についての正確な評価を行う方法としてリッカート尺度が検討されていたりします。なので、「リッカート尺度の論文」という位置付け自体は正しいと思います。「リッカート尺度を提案したことが貢献」というよりは、その有用性を評価した論文というのが正確なところではないでしょうか。

ここまで読んでいただき、ありがとうございました。


この記事が気に入ったらサポートをしてみませんか?