回帰モデルとPOモデルを比べてみる
計量経済学で勉強する回帰モデル($${Y_i=\alpha+\beta X_i+u_i}$$)と、因果推論で勉強するPOモデル($${Y_i=D_iY_{1i}+(1-D_i)Y_{0i}}$$)の対応が気になったのでまとめてみます。とくに重回帰モデルとの対応は、あまり教科書で見たことがなかったので参考になるかもしれません。
回帰モデルのおさらい
最も単純な単回帰モデルは、
$$
Y_i=\alpha+\beta D_i+u_i
$$
通常は$${X_i}$$を使いますが、今回は因果推論との対応を考えるためにダミー変数$${D_i}$$とします。$${\beta}$$を$${D_i}$$の効果と言うための【重要な条件】は、
$$
E[u_i|D_i]=0
$$
です。
セレクションバイアスがある場合は、重回帰モデル
$$
Y_i=\alpha+\beta D_i+\gamma X_i+u_i
$$
を使います。重回帰における【重要な条件】は、
$$
E[u_i|D_i,X_i]=0
$$
です。
POモデルのおさらい
Potential Outcomeは、
$$
Y_i=D_iY_{1i}+(1-D_i)Y_{0i}
$$
と書くことができます(Switching Equationとも言われます)。$${Y_{1i},Y_{0i}}$$の代わりに$${Y_i(1),Y_i(0)}$$と書くことも多いです。処理効果(ATT)である$${E[Y_{1i}-Y_{0i}]}$$を識別するための【重要な条件】は、$${D_i}$$の割り当てがランダムに行われていること、つまり、
$$
E[Y_i|D_i]=E[Y_i]
$$
であり、RCTの場合にこの条件が満たされるのでした。一方、セレクションバイアスがある場合は、コントロール変数$${X_i}$$を揃えた条件下で$${D_i}$$の割り当てがランダムに行われていること、つまり、
$$
E[Y_i|D_i,X_i]=E[Y_i|X_i]
$$
が識別の【重要な条件】であり、これを「無視可能性」とも言うのでした。
回帰モデルとPOモデルの対応〜RCTの場合
それでは本題です。POモデルをうまく変形して、$${\beta}$$が処置効果を示すような回帰モデルに当てはめましょう。RCTの場合、変形した結果が$${E[u_i|D_i]=0}$$を満たせば単回帰モデルが機能します。
$$
\begin{align*}
Y_i&=D_iY_{1i}+(1-D_i)Y_{0i} \\
&=\underset{\alpha}{\underline{E[Y_{0i}]}}+\underset{\beta}{\underline{(Y_{1i}-Y_{0i})}D_i}+\underset{u_i}{\underline{Y_{0i}-E[Y_{0i}]}}\\
&=\alpha+\beta D_i+u_i
\end{align*}
$$
RCTにおいては$${E[Y_{0i}|D_i]=E[Y_{0i}]}$$が成り立つので、
$$
\begin{align*}
E[u_i|D_i]&=E[Y_{0i}-E[Y_{0i}]|D_i]\\
&=E[Y_{0i}|D_i]-E[Y_{0i}]\\
&=E[Y_{0i}]-E[Y_{0i}]\\
&=0
\end{align*}
$$
により、単回帰の【重要な仮定】を満たすことがわかりました。
回帰モデルとPOモデルの対応〜セレクションバイアスがある場合
まずは先ほどと同じようにPOモデルを変形してみましょう。
$$
\begin{align*}
Y_i&=D_iY_{1i}+(1-D_i)Y_{0i} \\
&=E[Y_{0i}]+(Y_{1i}-Y_{0i})D_i+\underset{v_i}{\underline{Y_{0i}-E[Y_{0i}]}}\\
\end{align*}
$$
しかし、セレクションバイアスがある場合は$${E[Y_{0i}|D_i]=E[Y_{0i}]}$$が成り立たないので、
$$
\begin{align*}
E[v_i|D_i]&=E[Y_{0i}-E[Y_{0i}]|D_i]\\
&=E[Y_{0i}|D_i]-E[Y_{0i}]\\
&≠0
\end{align*}
$$
となり、単回帰の【重要な仮定】は成り立ちません。
そこで、新たな誤差項として$${\eta_i=v_i-E[v_i|X_i]}$$を定義しましょう。意味としては、$${X_i}$$を年齢・性別のようなグループを示す離散変数とすると、$${\eta_i}$$は$${i}$$さんの$${v_i}$$と所属グループ内平均との差と解釈できます。さらに$${E[Y_{0i}|X_i]}$$について線形関係、すなわち$${E[Y_{0i}|X_i]=\delta_0+X_i\delta_1}$$を仮定します。すると$${v_i}$$は、
$$
\begin{align*}
v_i&=\eta_i+E[v_i|X_i]\\
&=\eta_i+E[Y_{0i}-E[Y_{0i}]|X_i]\\
&=\eta_i+E[Y_{0i}|X_i]-E[Y_{0i}]\\
&=\eta_i+\delta_0+\delta_1X_i-E[Y_{0i}]
\end{align*}
$$
と書き換えられます。これで準備は整いました。POモデルの変形をさらに進めていきましょう。
$$
\begin{align*}
Y_i&=D_iY_{1i}+(1-D_i)Y_{0i} \\
&=E[Y_{0i}]+(Y_{1i}-Y_{0i})D_i+\underset{v_i}{\underline{Y_{0i}-E[Y_{0i}]}} (ここまで先と同じ)\\
&=E[Y_{0i}]+(Y_{1i}-Y_{0i})D_i+\underset{v_i}{\underline{\eta_i+\delta_1X_i-E[Y_{0i}]}}\\
&=\underset{\alpha}{\underline{\delta_0}}+\underset{\beta}{\underline{(Y_{1i}-Y_{0i})D_i}}+\underset{\gamma}{\underline{\delta_1}}X_i+\underset{u_i}{\underline{\eta_i}}
\end{align*}
$$
このとき重回帰の【重要な仮定】を確認すると、
$$
\begin{align*}
E[u_i|Di,X_i]&=E[v_i-E[v_i|X_i]|D_i,X_i]\\
&=E[v_i|D_i,X_i]-E[E[v_i|X_i]|D_i,X_i]\\
&=E[v_i|X_i]-E[v_i|X_i]\\
&=0
\end{align*}
$$
なお、最後の等号の第1項は「無視可能性」の仮定($${E[Y_i|D_i,X_i]=E[Y_i|X_i]}$$)、第2項は繰り返し期待値の法則を適用しています。
参考文献
末石直也『計量経済学ミクロデータ分析へのいざない』第3章
Angrist and Pischke "Mostly Harmless Econometrics" chap.2-3
この記事が気に入ったらサポートをしてみませんか?