【読書メモ】西内啓『統計学が最強の学問である』12
読んだ本
読書マインドマップ
読書メモ
第5章 ランダム化できなかったらどうするか?
回帰モデル:データの関連性を見るうえで、最も頻繁に利用される
→ただし、因果関係を適切に推定できるわけではない交互作用:変数間での相乗作用
回帰モデルを使ううえでの重要な注意点の一つ
→交互作用が本当に存在していないか(変数間に相乗効果がないか)交互作用項:2つの変数をかけ合わせた新しい説明変数
→交互作用項の導入で、すべてのグループ間の平均値の差が全て回帰係数によって表される
→正確さを求めて全ての交互作用項を調べるわけにもいかない
→何を以て重要とするかは、すべてのステークスホルダーたちによって慎重に決められなければならない傾向スコア:興味ある二値の説明変数について「どちらに該当するか」という確率のことをいう
→ランダム化が不可能か困難な因果関係の特定に重宝されてきた例:傾向スコアが同様の集団同士で比較すれば、「その他の条件」と「喫煙の有無」の関連性が、「喫煙の有無」と「肺がん」の関連性を歪めることがなくなる
→性別や居住地域などの諸条件から同じ喫煙率と推定される集団同士で比較する
感想
交互作用、交互作用項、傾向スコアに関しては勉強不足で知りませんでいた。文章だけだとよく理解できないので、図にしてみました。
たぶん、この理解でよいと思いますが、ちょっと自信がありません。他の本で補って勉強したいと思います。
最後まで読んでくださった方ありがとうございます。よろしければサポートいただけますと幸いです。本を買い、noteを書き続け、読書文化の輪を広げるために使います。