カテゴリカル探索的因子分析の求め方

尺度開発において,後に尺度の因子構造を調べるために因子分析を行う必要があります.

しかし,質問紙の回答形式を何件法を用いるかによって,因子分析の導入にちょっと注意が必要です.

5件法以上であれば通常の因子分析で良いのですが,2件法の場合はカテゴリカル因子分析という手法を用いた方が良いそうです(3〜4件法はグレー)(1).

カテゴリカル因子分析になじみのない方も多いと思いますので,以下,mirt関数を用いたカテゴリカル因子分析の方法について記載します.
(mirt関数ではFull最尤法でカテゴリカル因子分析の推定ができます)

<サンプルデータ>
7個の質問に対して7件法で回答したサンプルデータがあります.
Excelに以下のように入力し,ファイル名を「sample2.xlsx」として保存します.


RstudioのConsole画面に以下のように入力します.

install.packages("readxl")
library(readxl)
x<-read_excel("sample2.xlsx")

1行目は,readxlパッケージ(2)のインストールをしています.
      readxlパッケージはexcelをRに読み込む関数です.
2行目は,readxlパッケージを読み込んでいます.
3行目は,xに「sample2.xlsx」のファイルデータを格納しています.

install.packages("mirt")
library(mirt)

1行目は,mirtパッケージ(3)をインストールしてます.
2行目は,mirtパッケージを読み込んでいます.

result <- mirt(x,2)
result

1行目は,mirt関数をresultに格納しています.
    カッコ内の数字は因子数を示しています.

結果は・・・以下のように算出されます.

Full-information item factor analysis with 2 factor(s).
FAILED TO CONVERGE within 1e-04 tolerance after 500 EM iterations.
mirt version: 1.30 
M-step optimizer: BFGS 
EM acceleration: Ramsay 
Number of rectangular quadrature: 31
Latent density type: Gaussian 
Log-likelihood = -1853.231
Estimated parameters: 55 
AIC = 3816.461; AICc = 3860.778
BIC = 3996.476; SABIC = 3822.245
G2 (823487) = 1712.54, p = 1
RMSEA = 0.09, CFI = 0.777, TLI = 0.863

モデルの適合度を確認し,当てはまり具合を確認します.
今回のサンプルデータでは当てはまりが悪いですね(苦笑)

モデルの適合度指標(4):
RMSEA:当てはまりが良い(0.05より小さい ).当てはまりが悪い(0.1以上)
CFI/TLI:当てはまりが良い(0.95以上)
summary(result, rotate = "promax")

さらに,summary関数を用いてプロマックス回転を指定して結果を算出すると…

Rotation:  promax 
Rotated factor loadings:
         F1      F2    h2
Item1  0.7690  0.0990 0.719
Item2  0.8481  0.0693 0.761
Item3  0.5180 -0.2761 0.699
Item4  0.9198  0.0978 0.859
Item5  0.0619  0.8016 0.800
Item6  0.1594  0.9639 0.975
Item7  0.5424 -0.0957 0.459
Rotated SS loadings:  2.748 1.884 
Factor correlations: 
     F1   F2
F1 1.000 0.538
F2 0.538 1.000

因子負荷量が算出されます.また,F1とF2は因子を,h2は共通性を示してます.共通性とは,各測定値に対して共通因子の部分がどの程度あるのかを示す指標のことで,0~1 の値を取ります.もし 1 であれば因子によって説明される部分が 100%であることを示しています.

因子負荷量の見方としては特に決まった基準はないようですが,0.30か0.35のどちらかの基準を使うことが多いようです(5).また,2つ以上の因子に対して負荷量が0.40以上ある場合も注意が必要とのことです.
今回のサンプルデータでは,Item1,2,3,4,7で同じグループ,Item5,6で同じグループでした.

文献
(1)狩野 裕, 三浦 麻子:グラフィカル多変量解析―AMOS、EQS、CALISによる 目で見る共分散構造分析.現代数学社,2002
(2)Hadley Wickham and Jennifer Bryan (2019). readxl: Read Excel Files. 𝑟 package version 1.3.1. https://CRAN.R-project.org/package=readxl
(3)R. Philip Chalmers (2012). mirt: A Multidimensional Item Response Theory Package for the R Environment. Journal of Statistical Software, 48(6), 1-29. doi:10.18637/jss.v048.i06
(4)小杉考司・清水裕士:M-plusとRによる構造方程式モデリング入門.北大路書房,2014
(5)小宮あすか,布井雅人:Excelで今すぐはじめる心理統計 簡単ツールHADで基本を身につける.講談社,2018


この記事が気に入ったらサポートをしてみませんか?