統計|SEMのモデル比較—尤度比検定―
できれば毎月最低一記事はアップしよう,とは思っているがなかなかそうもいかない。昨年の9月まで毎月続けていた更新がとうとうストップし,10・11月はさぼってしまった。しかも9月まで11ヶ月連続だったのに12ヶ月手前で途切れてしまっていた。悔しい。
まぁでも1年連続やってたらバーンアウトしてたかもしれないから,ちょうどいいのかなと思うことにしたので,今年もなんとか頑張って更新しようと思う。懸念はネタがないことかな。
さて今回は構造方程式モデリング(SEM)のモデル適合に関する記事を書く。実は博士課程の研究の時に文献が全然見当たらなくて結構困った分析だったため,今回も自分用のメモとしてアップする。
SEMにおけるχ²値
SEMの適合度指標では,CFI,TLI,RMSEAなど様々なものが使われている。
※数値についてはHu & Bentler(1998, 1999)を参照。
そのうち,χ²値は帰無仮説「構成されたパス図は正しい」を検定するために利用する(小松,2007)。つまり,この値の確率が高いほど望ましい結果であると判断する。ただ,サンプルサイズの影響を受けやすいため,上記の他適合度指標を確認しつつ,モデルの判断をすることが推奨されている。
χ²値によるモデルの比較
モデルの当てはまりを比較する検定として,尤度比検定がある。尤度比検定では,Δχ²が有意でなければ等値制約の多いモデルを採択し,有意であれば制約の少ないモデルを採択する(浅野,2014)。
計算方法としては3段階ある(宮野,2018)。
1)Δχ²=制約が多いモデル①と少ないモデル②のχ²値の差
2)Δdf=モデル①とモデル②の自由度の差
3)1)を2)で割って検定する。1)が有意でなければモデル①を採択する。
難しいので以前分析した尺度作成の研究で例を示してみる。因みに用いる数値はこちら。
ここでは,尺度の因子構造について1因子構造,4因子構造,2次因子構造の3つを検討した。
1因子構造 χ² (189) = 957.09, AIC =1041.09
4因子構造 χ² (183) = 511.92, AIC = 607.92
2次因子構造 χ² (185) = 513.16, AIC = 605.16
(ついでにAICも書いてみた)
さて,Excelで計算してみよう。
Δχ²検定をExcelでやってみる
とりあえず1因子構造と4因子構造で分析をしてみる。先に文章で説明した後に全てを埋めた画像で示す。
各モデルの名前をA列(A2,A3)に入力し,χ²値(Chi-square)をB列,自由度(df)をC列,p値をD列,モデルに差があるかないかの判別(invariant)をE列とする。
計算には各モデルのχ²値と自由度が必要なため,B2,B3にχ²値を,C2,C3に自由度を入力する。
行4でχ²値と自由度の差(Δ)を求めるため,A4にdifferenceとしてB4,C4でそれぞれを計算する。計算式は以下の通り。
B4 = ABS(B3-B2)
C4 = ABS(C3-C2)D5で3で計算した数値のp値を求め,E5でモデルが不変か判別をする。計算式は以下の通り。
D5 = CHISQ.DIST.RT(B4,C4)
E5 = IF(D4<0.05,"No","Yes")
ということで結果は「Δχ² (6) = 445.17,p < .001」となる。有意だったため(AICや他適合度を確認しつつ),4因子構造が採択となる。
モデルが3つあったのでもう1パターン,4因子構造と2次因子構造の分析をしてみた結果,以下の通りとなった。
結果は「Δχ² (2) = 1.24,p = .54」となる。有意ではなかったため(AICや他適合度を確認しつつ),制約の多い2次因子構造が採択となる。
要らないと思うけど上記のExcelファイルをアップしておく。
信頼区間の求め方もほんとはやった方がいいんだろうけど自分には難解なのでここまでとする。
2024/06/25
JASPで初めてSEMをやってみたところ,複数モデルで検討すると自動でModel fitのDifference testとして,Δχ²,df,p値を出してくれることが分かった。
JASPでSEMはRのコードを書かないといけない(?)のでずっと避けていたけど,やってみれば簡単なのでこれからはAmosにサヨナラしてJASPで完結したい。
皆JASP使おう。そして解説動画,サイトをもっと増やしてくれ。
(1つ致命的な懸念点が,パス図が見にくすぎるうえに標準化係数を書いてくれない。)
まとめ
冒頭にも書いたけど博論を書いている時にこの分析を使いたくて必死に調べたけど全然文献がないという状況だった。その過程で海外の人が説明してくれているYouTubeの動画があって,今回はその時にメモしたことを掘り起こして整理してみたという備忘録だった(動画の出所は見つからなかった)。
毎度のことだけど,月内に更新したくて突貫で書いたからあとで修正するかもしれない。
今年も分析に関してわからないことがあったら必死に調べてまとめようと思う。理解や説明が間違えていたらコメントください。すぐに直して学びます。
余談としてだからなんだという話だが,画像作ってるときにExcelの列(行)間のこの線,選択してない場合はグラデーションになってるのに気づいた。知らなかった。どんな意図があるんだろ。