Gries (2021) 混合効果モデル論文のレビュー

2021年9月7日 15:27

割と最近に以下の論文が出ていた。

Gries, S. T. (2021). (Generalized Linear) Mixed‐Effects Modeling: A Learner Corpus Example. Language Learning. https://doi.org/10.1111/lang.12448

混合効果モデル (mixed-effects model) の論文で言うと，同じジャーナルには2015年にLinck and Cunnings (2015) が出ているので，同じテーマの論文をわざわざまた掲載しなくてもよいのではとも思ったが，読んでみると冒頭の理論的な部分は重複があるものの，Linck and Cunnings (2015) が入門編なのに対し，こちらはより発展した内容を扱っていた（なので，正直なところ読んでいて理解が追い付かないところもちらほらあった）。

細かい内容は実際の論文を読んだほうが良いとして，ここではLinck and Cunnings (2015) で書かれていないこととして，具体的どのような内容が含まれているかを書いておこうと思う。

モデルに含める変数の決め方

「決め方」と書くと何かルールがあるように思えるが，そういうわけではなく，変数の含め方のアプローチが違うと言ったほうが良いだろうか。Linck and Cunnings (2015) では実証実験のデータを扱っており，要因計画に基づいて3つの変数とその交互作用（と1つの統制変数）を固定効果に入れているが，Gries (2021) ではコーパスにおける大量のデータを分析しているため，理論や先行研究に基づきつつ多数の統制変数と興味のある変数を入れているという形（これは最後に触れる検定力とも関わる）。なので，この2つではそもそも扱っているデータの性質が違うともいえる。

分析前のデータ分布の確認

混合効果モデルだけではなくすべての統計モデリングで重要になることではあるが，Gries (2021) ではLinck and Cunnings (2015) よりもかなり詳細に事前のデータ分布の確認について説明している。

モデル選択

これも実際の分析ではしばしば問題になるが，Linck and Cunnings (2015) では基本的な部分しか述べられていなかった。Gries (2021) ではLRTやAICを用いてbackwardでモデルを選択する方法を紹介している（※必ずしもこの方法を推奨しているわけではなく，あくまで事例の1つとして取り上げている）。その中で，複雑なモデルがしばしばconvergenceしない問題にも言及されている。

モデル診断と妥当化

簡単ではあるものの，選択されたモデルの診断方法として残差分析や多重共線性に触れられている。また，妥当化としては，言語研究ではメジャーでないとしつつも，交差妥当化に言及している。

モデル解釈

モデル解釈の方法としてnullモデルとの比較やAIC，marginal / conditional R2などが触れられている。また，分類精度の評価方法としてC scoreやprecision, recallなどが紹介されている。

そのほか，モデルの結果の表での提示の仕方，モデルに含まれる効果の可視化，変量効果 (random effect) の検討についても説明されている。

他の分析方法との比較

サポートベクターマシンやランダムフォレストなど最近の言語研究でも比較的使用されるようになった方法と比較して，混合効果モデルのメリット・デメリットを述べている。ただ，

"there are alternatives to MEM, but they are no magic wands. They also come with different goals/characteristics, and they definitely come with their own challenges that are only slowly being discussed in linguistics." (p. 31)

と述べられているように，この点はまだまだ議論が足りないところのようだ。同じように，今後混合効果モデルについて議論がもっと行われなくてはいけない点として，convergence warningsをどのように扱うか，モデル選択の方法，モデルの妥当化，そして検定力が挙げられている。（検定力については最近もKumle et al. (2021) で詳しく述べられていたけど，これもかなり限られた条件の中で検定力をどう算出するかを説明したものだった）