見出し画像

【因子分析】心理評価研究における因子分析について、落とし穴と対処法について整理した論文(Sellbom & Tellagen, 2019)

最近、パーセリングという手法についての文献を見ていましたが、もう少し広げて文献調査をしたところ、因子分析における注意点に関する比較的新しい論文を発見しました。(備忘的意味合いでしっかりまとめた結果、長文となってしまいました)

Sellbom, M., & Tellegen, A. (2019). Factor analysis in psychological assessment research Common pitfalls and recommendations. Psychological assessment, 31(12), 1428.


どんな論文?

この論文は、心理学の評価研究でよく使われる因子分析について、その一般的な問題点や改善策を紹介したものです。

因子分析は、質問項目の関連性を分析し、背後にある隠れた構造(構成概念)を見つけたり、理論的に言われている概念と質問項目の妥当性を確認するための方法です。

著者たちは、因子分析を行う際に注意すべき点として、まず質問項目の分布特性に気をつける必要があると強調しています。特に、個々の項目が持つユニークな情報や項目ごとの分布特性が失われてしまうことから、質問項目をまとめる「パーセリング」は、避けるべきだとしています。また、データに合わせた適切な推定方法を選ぶことの重要性も述べています。

(これまで見てきたパーセリングの議論とは異なり、多少慎重派な印象を受けます。)

さらに、因子分析の結果を評価する際は、モデルの適合度(データにどれだけ合っているか)だけに頼るのではなく、理論的な背景を重視すべきだと強調しています。

最後に、最近注目されている「探索的構造方程式モデリング(ESEM)」や「バイファクターモデル」という新しい手法についても触れていますが、特にバイファクターモデルの使用には慎重な判断が必要だと警告しています。


因子分析にまつわる問題点(落とし穴)とは何か?

この論文では、心理評価における因子分析の問題点と改善策について、統計的な専門家の視点から以下の点を中心に整理されています。

1.  項目の分布特性への配慮
問題点として、因子分析に用いられる質問項目の分布が正規分布に従っていない場合や、項目間の相関が人工的に高くなることが挙げられます。特に、スケールが偏っていると、因子構造の歪みが生じる可能性があります。  

【改善策】項目のスケールや分布を確認し、必要に応じて適切な推定方法を選択することが重要です。


 2.項目パーセリングのリスク
項目パーセリング(複数の項目をまとめて一つのスコアにする手法)は、因子分析において広く用いられますが、これは個々の項目の特性を隠してしまうリスクがあります。特に、評価ツールの内部構造を正確に評価する際には、パーセリングによって因子構造が見えにくくなることがあります。  

【推奨される対応】パーセリングを避け、個々の項目ごとのデータを詳細に分析することが挙げられています。


 3.適切な推定方法の選択
因子分析では、データの性質に合わせた推定方法を選択することが重要です。しかし、実際の研究では、多くの場合に最大尤度法(ML推定)が無批判に用いられています。ML推定は、データが連続的で正規分布している場合には有効ですが、これが満たされない場合にはバイアスが生じる可能性があります。  

【改善策】例えば項目が順序尺度の場合にはWLSMV(加重最小二乗法)やULSMV(無加重最小二乗法)など、非正規分布データに対応したロバストな推定方法を使用することが推奨。


4.新しいモデルの使用における注意点

心理学領域では、探索的構造方程式モデリング(ESEM)やバイファクターモデリング(二因子モデル)といった新しい手法が出てきているようです。より柔軟な因子構造の評価を可能にしますが、特にバイファクターモデルは適用が難しく、モデル適合度の向上に惑わされやすい点があります。  

【改善策】これらの手法を適用する際は、モデルの理論的妥当性を十分に検討し、過度に複雑なモデルを選ばないようにすることが重要。


因子分析における理論的裏付けのためのアプローチ

この論文の結論は、モデルの適合度に頼るのではなく、理論的な観点から因子構造を論ずることが大事、と主張していますが、理論的観点からの裏付けをどのように行えばよいか、という点にも触れられています。

■仮説や理論モデルに基づく因子構造の事前設定

当然と言えば当然ですが、本論文では、因子分析を実施する前に、測定対象となる理論的な構成概念や仮説に基づいて、因子モデルを設定すべきと説いています。
具体的には、測定している心理特性がどのような潜在因子で構成されるべきか、理論的に妥当な数の因子や、それぞれの因子に関連する項目を明確に定義します。これにより、因子分析で得られた結果が、事前に予測された理論モデルと一致しているかを確認することができます。

■理論的な整合性と実証データの一致を検討

適合度指標が良好なモデルであっても、それが理論的に妥当であるかを検討することが必要と説明されます。たとえば、バイファクターモデル(1つの一般因子と、複数のグループ因子から構成される因子モデル)では、一般因子と各グループ因子が独立していることが前提となりますが、そのようなモデルが本当に理論的に支持されるかどうかを考慮することが求められる。
これには、既存の文献や先行研究との整合性を確認し、そのモデルが過去の研究や理論にどのように一致しているかを評価することが大事とのこと。


■代替モデルとの理論的比較

統計的なモデル比較(例えば、1因子モデルと2因子モデルの適合度比較)だけでなく、各モデルがどのような理論的背景を持つか、理論的にどちらが妥当であるかを比較すべしとのこと。
単に適合度指標が優れたモデルを選ぶのではなく、各モデルが提案する因子構造がどのように理論に裏付けられているかを検討します。例えば、複数の因子が高度に相関している場合、それらを一つの潜在因子として扱うことが理論的に妥当か、分けて考えるべきかを理論に基づいて検討することが重要。


■外的基準との一致

理論的な裏付けをさらに強化するためには、因子分析で導き出された因子構造が、外的な基準や他の指標とも一致するかを確認することが有効なよう。
たとえば、心理測定の結果が他の関連する心理特性や行動とどう関連しているかを調べ、その因子構造が現実の現象を理論的に説明できるかを検証します。これにより、単に統計的な適合度が高いだけでなく、理論的にも妥当なモデルであることを確認できるとのこと。

■モデルの再指定(Model Respecification)

初期の因子分析結果が理論的に整合しない場合、モデルの再指定が必要です。この際、再指定されたモデルが理論的に妥当であり、統計的なモデル改良が理論的な理由に基づくものであることを確認する必要があるとのこと。
例えば、特定の因子間の関係が理論的に無意味であれば、それを修正する必要があるようです。


最近注目されている手法:ESEMとバイファクターモデル

本論文では、心理学領域における最近注目の手法に対しても、慎重に分析を行うことを提案しています。ここでは、簡単に両者の紹介を行うことに留めますので、興味のある方は調べてみてください。

■ESEM(探索的構造方程式モデリング: Exploratory Structural Equation Modeling)
心理学などのデータ分析で使われる手法。探索的因子分析(EFA)構造方程式モデリング(SEM)の特徴を組み合わせたもの。
通常、因子分析には「探索的」と「確認的」の2つの方法がありますが、ESEMはその中間に位置する柔軟なアプローチです。

性格テストを例に考えます。性格テストの項目が「社交性」「感情の安定性」「リーダーシップ」の3つの因子に分類されると仮定すると、通常の確認的因子分析(CFA)では、各質問が特定の因子にしか関連しないと仮定しますが、ESEMでは、ある質問項目が複数の因子(例えば、社交性とリーダーシップ)の影響を受けている可能性を考慮して分析結果を示すようです。

ただし、項目が複数の因子に負荷されるため、因子負荷量(各因子が項目に与える影響の強さ)が複数の因子に分散することで、個々の因子がどのように各項目に影響を与えているのか、結果の解釈が難しくなるリスクがあるとのこと。特に、因子負荷量が小さい場合、因子がどのように影響しているかを明確に説明するのが困難な様子。

また、ESEMは、探索的な手法に基づいているため、事前に理論に基づいて因子構造を仮定することなく、自由に因子間の関係を見つけ出せるメリットがある一方、理論的にしっかりとサポートされたモデルを構築することが難しくなるのも欠点なようです。

■バイファクターモデル
バイファクターモデルとは、質問やテストの結果を分析するときに使われる統計的なモデルの一種です。
このモデルでは、全ての質問項目に共通して影響を与える「一般因子」と、特定の質問項目にだけ影響を与える「グループ因子」という2種類の因子が設定されます。

たとえば、性格テストを考えると、一般因子は「全体的な性格傾向」を表し、グループ因子は「社交性」や「感情の安定性」といった個別の性格要素を表すイメージです。各質問項目は、これらの因子から影響を受けていると仮定して分析します。

このモデルの特徴は、項目ごとの複数の因子の影響を同時に考慮できることです。これにより、項目ごとの関係性や全体的な構造をより詳細に理解することができます。バイファクターモデルは、特に性格テストや心理測定においてよく用いられます。イメージとして以下のような図で表現されます。

感じたこと

因子分析も奥が深いです。駆け出しの研究者としては、適合度に一喜一憂してしまう部分が大きいですが、一方で、理論的裏付けや外的基準との整合性など、押さえるべきことをしっかり押さえることが重要だと感じました。

この記事が気に入ったらサポートをしてみませんか?