見出し画像

【パーセリング】手法に関する利点・欠点を整理した、パーセリング利用者の必須文献とも言うべき論文(Little et al., 2002)

今回もパーセリングについて扱います。項目をある程度まとめてしまうのって、問題ないの?ちゃんと見たい概念が図れるの?という疑問が頭に浮かびます。そうした疑問に答えてくれる文献です。
2024年10月5日時点で7679という圧倒的な引用数を誇っており、パーセリングについて押さえておくべき基礎文献と言えそうです。

Little, T. D., Cunningham, W. A., Shahar, G., & Widaman, K. F. (2002). To parcel or not to parcel Exploring the question, weighing the merits. Structural equation modeling, 9(2), 151-173.


どんな論文?

この論文は、心理学や社会科学で使われる構造方程式モデリング(SEM)において、パーセリングを使用するべきかどうかを、良い面(Pros)と悪い面(Cons)に分けて論じたものです。

パーセリングとは、複数の質問項目(アイテム)を合計して1つの指標(パーセル)として扱う手法です。
この方法は、アイテム単位での分析よりも統計的に扱いやすく、データのノイズを減らすことができますが、使い方を誤ると誤った結果につながる可能性があるものです。

論文では、パーセリングを使うべきかどうかは、研究者の目的やデータの性質によって異なるとしています。例えば、データの構造を細かく理解したい場合は、パーセリングを使わずに個々のアイテムを直接分析する方が適しています。
しかし、パーセル法を使えば、モデルの複雑さを減らし、モデル間の関連性について統計的に安定した結果が得られやすくなるとも述べています。

また、パーセリングが適切に機能するためには、アイテムが単一の次元(例:一つの性格特性)に沿っていることが重要で、複数の次元が混ざっている場合は慎重な検討が必要だとしています。


パーセリングの利点と欠点

7600越えの引用数を誇る本論文の肝ともいえる、パーセリングの利点と欠点について、以下の通りまとめました。

パーセリングのPros(利点)

  1. 信頼性と測定の安定性の向上
    パーセリングを用いることで、アイテム単位での測定誤差が軽減される。特にアイテムが持つ「ランダム誤差」や「特異的要因」による影響を平均化するため、測定の安定性が向上するため、より信頼性の高い指標が得られ、モデルの推定精度が高まる。

  2. 統計モデルのパラメータ数を削減し、適合度を改善
    パーセリングを使うことで、モデルで推定するパラメータの数が少なくなり、統計的なモデルフィットが改善されることがある。特に、アイテムごとに誤差や残差の関連を推定する必要が減るため、モデルがより簡潔になります。これは、サンプルサイズが小さい場合や、複雑なモデルを扱う場合に有利となる。

  3. データ分布の問題を軽減
    個々のアイテムは非正規分布を示すことがありますが、パーセリングによりアイテムを集約することで、分布の歪みが軽減され、正規分布に近づきます。これにより、構造方程式モデリング(SEM)の前提条件である正規性に適合しやすくなる。

  4. 因子構造の簡潔化
    パーセリングは、構成概念(例えば、性格特性など)をより簡潔かつ明瞭に測定できます。これは、アイテムレベルでは捉えきれない因子のコア部分を強調し、統計モデルの効率を高めることができます。


パーセリングのCons(欠点)

  1. 多次元性の損失とモデルの歪み
    アイテムが多次元的である場合(例えば、1つの質問が「ストレス」と「不安」の両方に関連するように、1つのアイテムが複数の概念に影響を与える場合)、パーセリングにすることでこの複数の次元が混ざり合い、測定モデルが不正確になる可能性がある。特に、アイテムが異なる次元に負荷をかける場合、パーセリングすることでそれが隠れてしまい、誤った因子負荷を生じさせることがある。

  2. モデルの誤指定が見えなくなるリスク
    パーセリングは、モデルの誤指定(例えば「ストレス」や「不安」などといった構成概念と、それを測定するために使用するアイテムとの関係が、モデルの中で誤って定義されている状態を指す)を隠してしまう可能性があり、特定のアイテム間に存在する二重負荷や誤差の相関などが見えなくなることがある。これにより、実際には誤ったモデルが統計的に適合してしまい、結果として本来見つかるべき問題が隠れてしまうリスクがある。

  3. 詳細なアイテムレベルの関係性の理解が困難になる
    パーセリングを使用すると、アイテム間の微細な相関や独立した情報が失われ、アイテムレベルでの理解が難しくなります。研究者がアイテム単位での詳細な関係を理解したい場合には、パーセル化は不適切と言える。

まとめると、パーセリングには、多次元性の損失やモデル誤指定のリスクといった欠点がありますが、測定の安定性向上やモデルフィットの改善といった利点も多く、研究目的に応じて慎重に使用することが重要だと言えます。

特に、アイテムが単一の次元を測定している場合や、簡潔なモデルを構築する必要がある場合には、パーセリングは有効な手法です。
一方、多次元性のある構造や、個々のアイテムの関係を詳しく理解することが重要な場合には、パーセル法は不適切と言えそうです。


パーセリングの使用に対する2つの立場

この論文の興味深い点は、研究における2つの立場、実証主義と実用主義の立場から、パーセリングの使用に対する視点を整理している点です。

簡単に整理すると、

■実証主義の立場では、データ分析は可能な限り「純粋な」形で行われるべき、つまり、アイテムレベルでのデータをできるだけそのまま反映し、個々のアイテムが測定しているすべての要素をモデルに含めるべきだという考え方に立つ。
パーセリングは、この立場から見ると「不自然な操作」と見なされ、個々のアイテムの詳細な構造が隠れてしまうことで、分析結果が歪む可能性があるとされる。
そのため、この立場に立つ研究者は、パーセリングを「データの不正な操作」として捉え、データはできる限りそのまま(すなわち、各個人の回答を細かく反映した形)で分析するべきだと考える傾向がある。

実用主義の立場では、研究の目的に応じて柔軟に分析手法を選択すべきだと考えます。パーセリングは、この立場においては「実用的で効率的な手法」と見なされ、アイテムを集約して重要な構成要素を強調することが許容される。
この立場では、研究者が自らの目的に合った測定手法やモデルを選ぶ自由があると考えます。たとえば、複雑なアイテムレベルのノイズや誤差を減らし、核心的な構成概念を明確に捉えるためには、パーセリングが適切な手法となることがあるという見方となる。
このアプローチでは、パーセリングを使用するかどうかは研究の目的次第であり「厳密さよりも有用性」に価値が置かれる。

以上に見たように、実証主義はデータの純粋性を重視し、可能な限り詳細な情報を含めた分析を求める一方、実用主義は研究の目的や効率を重視し、パーセリングのような手法を柔軟に取り入れることを支持しているようです。


感じたこと

測定項目をまとめてしまっていいの?という疑問について、利点・欠点の整理や、立場の整理を行うことで、「研究の目的次第では可能」と結論づけてくれた論文として、有用性が高い文献だと感じました。

特に、測定項目間の関係に着目する研究ではなく、複数の項目で構成される概念間の関連性を見る点に重きが置かれる研究ならば、柔軟に利用することが認められる、という判断基準の提示はありがたいです。

参考までに、過去の投稿も貼り付けておきます。


いいなと思ったら応援しよう!