PRML自習ノート - chapter 13 -
Exercise (13.1) - (13.10)
Exercise (13.1)
図13.3のグラフの場合,head-to-tail nodeである$${\mathbf{x}_{n-1}}$$が観測されることによって$${\mathbf{x}_n}$$と$${\mathbf{x}_{n-2}}$$が分離されているため,
$$
\begin{align*}
p(\mathbf{x}_n|\mathbf{x}_1,\cdots,\mathbf{x}_{n-1})&=\frac{p(\mathbf{x}_n,\mathbf{x}_1,\cdots,\mathbf{x}_{n-2}|\mathbf{x}_{n-1})}{p(\mathbf{x}_1,\cdots,\mathbf{x}_{n-2}|\mathbf{x}_{n-1})}\\
&=\frac{p(\mathbf{x}_n|\mathbf{x}_{n-1})p(\mathbf{x}_1,\cdots,\mathbf{x}_{n-2}|\mathbf{x}_{n-1})}{p(\mathbf{x}_1,\cdots,\mathbf{x}_{n-2}|\mathbf{x}_{n-1})}\\
&=p(\mathbf{x}_n|\mathbf{x}_{n-1})
\end{align*}
$$
となる。
図13.4のグラフの場合,head-to-tail nodeである$${\mathbf{x}_{n-2},\ \mathbf{x}_{n-1}}$$が観測されることによって$${\mathbf{x}_n}$$と$${\mathbf{x}_{n-3}}$$が分離されているため,
$$
\begin{align*}
p(\mathbf{x}_n|\mathbf{x}_1,\cdots,\mathbf{x}_{n-1})&=\frac{p(\mathbf{x}_n,\mathbf{x}_1,\cdots,\mathbf{x}_{n-3}|\mathbf{x}_{n-2}, \mathbf{x}_{n-1})}{p(\mathbf{x}_1,\cdots,\mathbf{x}_{n-3}|\mathbf{x}_{n-2}, \mathbf{x}_{n-1})}\\
&=\frac{p(\mathbf{x}_n|\mathbf{x}_{n-2}, \mathbf{x}_{n-1})p(\mathbf{x}_1,\cdots,\mathbf{x}_{n-3}|\mathbf{x}_{n-2}, \mathbf{x}_{n-1})}{p(\mathbf{x}_1,\cdots,\mathbf{x}_{n-3}|\mathbf{x}_{n-2}, \mathbf{x}_{n-1})}\\
&=p(\mathbf{x}_n|\mathbf{x}_{n-2}, \mathbf{x}_{n-1})
\end{align*}
$$
となる。
Exercise (13.2)
$${p(\mathbf{x}_1,\cdots,\mathbf{x}_{N})=p(\mathbf{x}_1)\prod_{l=2}^Np(\mathbf{x}_l|\mathbf{x}_{l-1})}$$のとき,
$$
\begin{align*}
p(\mathbf{x}_n|\mathbf{x}_1,\cdots,\mathbf{x}_{n-1})&=\frac{p(\mathbf{x}_1,\cdots,\mathbf{x}_{n})}{p(\mathbf{x}_1,\cdots,\mathbf{x}_{n-1})}\\
&=\frac{\sum_{\mathbf{x}_{n+1}}\cdots\sum_{\mathbf{x}_{N}}p(\mathbf{x}_1,\cdots,\mathbf{x}_{N})}{\sum_{\mathbf{x}_{n}}\cdots\sum_{\mathbf{x}_{N}}p(\mathbf{x}_1,\cdots,\mathbf{x}_{N})}\\
&=\frac{\sum_{\mathbf{x}_{n+1}}\cdots\sum_{\mathbf{x}_{N}}p(\mathbf{x}_1)\prod_{l=2}^Np(\mathbf{x}_l|\mathbf{x}_{l-1})}{\sum_{\mathbf{x}_{n}}\cdots\sum_{\mathbf{x}_{N}}p(\mathbf{x}_1)\prod_{l=2}^Np(\mathbf{x}_l|\mathbf{x}_{l-1})}\\
&=\frac{p(\mathbf{x}_1)\prod_{l=2}^{n}p(\mathbf{x}_l|\mathbf{x}_{l-1})\prod_{m=n+1}^{N}\sum_{\mathbf{x}_{m}}p(\mathbf{x}_m|\mathbf{x}_{m-1})}{p(\mathbf{x}_1)\prod_{l=2}^{n-1}p(\mathbf{x}_l|\mathbf{x}_{l-1})\prod_{m=n}^{N}\sum_{\mathbf{x}_{m}}p(\mathbf{x}_m|\mathbf{x}_{m-1})}\\
&=p(\mathbf{x}_n|\mathbf{x}_{n-1})
\end{align*}
$$
$${p(\mathbf{x}_1,\cdots,\mathbf{x}_{N})=p(\mathbf{x}_1)p(\mathbf{x}_2|\mathbf{x}_1)\prod_{l=3}^Np(\mathbf{x}_l|\mathbf{x}_{l-2},\mathbf{x}_{l-1})}$$のとき,
$$
\begin{align*}
p(\mathbf{x}_n|\mathbf{x}_1,\cdots,\mathbf{x}_{n-1})&=\frac{p(\mathbf{x}_1,\cdots,\mathbf{x}_{n})}{p(\mathbf{x}_1,\cdots,\mathbf{x}_{n-1})}\\
&=\frac{\sum_{\mathbf{x}_{n+1}}\cdots\sum_{\mathbf{x}_{N}}p(\mathbf{x}_1,\cdots,\mathbf{x}_{N})}{\sum_{\mathbf{x}_{n}}\cdots\sum_{\mathbf{x}_{N}}p(\mathbf{x}_1,\cdots,\mathbf{x}_{N})}\\
&=\frac{\sum_{\mathbf{x}_{n+1}}\cdots\sum_{\mathbf{x}_{N}}p(\mathbf{x}_1)p(\mathbf{x}_2|\mathbf{x}_1)\prod_{l=3}^Np(\mathbf{x}_l|\mathbf{x}_{l-2},\mathbf{x}_{l-1})}{\sum_{\mathbf{x}_{n}}\cdots\sum_{\mathbf{x}_{N}}p(\mathbf{x}_1)p(\mathbf{x}_2|\mathbf{x}_1)\prod_{l=3}^Np(\mathbf{x}_l|\mathbf{x}_{l-2},\mathbf{x}_{l-1})}\\
&=\frac{p(\mathbf{x}_1)p(\mathbf{x}_2|\mathbf{x}_1)\prod_{l=3}^{n}p(\mathbf{x}_l|\mathbf{x}_{l-2}, \mathbf{x}_{l-1})\prod_{m=n+1}^{N}\sum_{\mathbf{x}_{m}}p(\mathbf{x}_m|\mathbf{x}_{m-2},\mathbf{x}_{m-1})}{p(\mathbf{x}_1)p(\mathbf{x}_2|\mathbf{x}_1)\prod_{l=3}^{n-1}p(\mathbf{x}_l|\mathbf{x}_{l-2}, \mathbf{x}_{l-1})\prod_{m=n}^{N}\sum_{\mathbf{x}_{m}}p(\mathbf{x}_m|\mathbf{x}_{m-2},\mathbf{x}_{m-1})}\\
&=p(\mathbf{x}_n|\mathbf{x}_{n-2}, \mathbf{x}_{n-1})
\end{align*}
$$
Exercise (13.3)
観測データ$${\{\mathbf{x}_n\}}$$の任意の2つのノードを結びつけるノードがhead-to-tailでかつ観測されないため,観測データ間に条件付き独立が成立しない。
Exercise (13.4)
13.2.1節の$${\boldsymbol\phi}$$を$${\mathbf{w}}$$に置き換えれば,同様のアプローチが可能。
Exercise (13.5)
$${\sum_{k=1}^K\pi_k=1}$$より,ラグランジュの未定乗数法を用いて
$$
\begin{align*}
\widetilde{\mathcal{Q}}(\boldsymbol\theta,\boldsymbol\theta^{\rm old})=\mathcal{Q}(\boldsymbol\theta,\boldsymbol\theta^{\rm old})+\lambda\left(\sum_{k=1}^K\pi_k-1\right)
\end{align*}
$$
に対する$${\boldsymbol\pi}$$の最適解を求める。
$$
\begin{align*}
\frac{\partial\widetilde{\mathcal{Q}}(\boldsymbol\theta,\boldsymbol\theta^{\rm old})}{\partial\pi_k}&=\frac{\gamma(z_{1k})}{\pi_k}+\lambda\\
&=0\\
\therefore \pi_k&=-\frac{\gamma(z_{1k})}{\lambda}
\end{align*}
$$
得られた解を$${\sum_{k=1}^K\pi_k=1}$$に代入すると,
$$
\begin{align*}
\sum_{k=1}^K\pi_k&=-\frac{\sum_{k=1}^K\gamma(z_{1k})}{\lambda}\\
&=1\\
\therefore \lambda&=-\sum_{k=1}^K\gamma(z_{1k})\\
\pi_k&=-\frac{\gamma(z_{1k})}{\lambda}\\
&=\frac{\gamma(z_{1k})}{\sum_{k=1}^K\gamma(z_{1k})}
\end{align*}
$$
$${\sum_{k=1}^KA_{jk}=1}$$より,ラグランジュの未定乗数法を用いて
$$
\begin{align*}
\widetilde{\mathcal{Q}}(\boldsymbol\theta,\boldsymbol\theta^{\rm old})=\mathcal{Q}(\boldsymbol\theta,\boldsymbol\theta^{\rm old})+\sum_{j=1}^K\lambda_j\left(\sum_{k=1}^KA_{jk}-1\right)
\end{align*}
$$
に対する$${\mathbf{A}}$$の最適解を求める。
$$
\begin{align*}
\frac{\partial\widetilde{\mathcal{Q}}(\boldsymbol\theta,\boldsymbol\theta^{\rm old})}{\partial A_{jk}}&=\frac{\sum_{n=2}^N\xi(z_{n-1,j},z_{nk})}{A_{jk}}+\lambda_j\\
&=0\\
\therefore A_{jk}&=-\frac{\sum_{n=2}^N\xi(z_{n-1,j},z_{nk})}{\lambda_j}
\end{align*}
$$
得られた解を$${\sum_{k=1}^KA_{jk}=1}$$に代入すると,
$$
\begin{align*}
\sum_{k=1}^KA_{jk}&=-\frac{\sum_{k=1}^K\sum_{n=2}^N\xi(z_{n-1,j},z_{nk})}{\lambda_j}\\
&=1\\
\therefore \lambda_j&=-\sum_{k=1}^K\sum_{n=2}^N\xi(z_{n-1,j},z_{nk})\\
\therefore A_{jk}&=-\frac{\sum_{n=2}^N\xi(z_{n-1,j},z_{nk})}{\lambda_j}\\
&=\frac{\sum_{n=2}^N\xi(z_{n-1,j},z_{nk})}{\sum_{l=1}^K\sum_{n=2}^N\xi(z_{n-1,j},z_{nl})}
\end{align*}
$$
Exercise (13.6)
初期値として$${\pi_k=0}$$に選んだ場合,$${\gamma(z_{1k})=0}$$となるため,
$$
\begin{align*}
\pi_k^{\rm new}&=\frac{\gamma(z_{1k})}{\sum_{k=1}^K\gamma(z_{1k})}\\
&=0
\end{align*}
$$
となる。
初期値として$${A_{jk}=0}$$に選んだ場合,$${\sum_{n=2}^N\xi(z_{n-1,j},z_{nk})=0}$$となるため,
$$
\begin{align*}
A_{jk}^{\rm new}&=\frac{\sum_{n=2}^N\xi(z_{n-1,j},z_{nk})}{\sum_{l=1}^K\sum_{n=2}^N\xi(z_{n-1,j},z_{nl})}\\
&=0
\end{align*}
$$
となる。
Exercise (13.7)
$${p(\mathbf{x}_n|\boldsymbol\phi_k)=\mathcal{N}(\mathbf{x}_n|\boldsymbol\mu_k,\boldsymbol\Sigma_k)}$$のとき,
$$
\begin{align*}
\frac{\partial\mathcal{Q}(\boldsymbol\theta,\boldsymbol\theta^{\rm old})}{\partial\boldsymbol\mu_k}&=-\sum_{n=1}^N\gamma(z_{nk})\boldsymbol\Sigma_k^{-1}(\boldsymbol\mu_k-\mathbf{x}_n)\\
&=-\boldsymbol\Sigma_k^{-1}\left\{\left(\sum_{n=1}^N\gamma(z_{nk})\right)\boldsymbol\mu_k-\sum_{n=1}^N\gamma(z_{nk})\mathbf{x}_n\right\}\\
&=\mathbf{0}\\
\therefore \boldsymbol\mu_k^{\rm new}&=\frac{\sum_{n=1}^N\gamma(z_{nk})\mathbf{x}_n}{\sum_{n=1}^N\gamma(z_{nk})}
\end{align*}
$$
$$
\begin{align*}
\frac{\partial\mathcal{Q}(\boldsymbol\theta,\boldsymbol\theta^{\rm old})}{\partial\boldsymbol\Sigma_k}&=-\frac{1}{2}\sum_{n=1}^N\gamma(z_{nk})\left\{\frac{\partial}{\partial\boldsymbol\Sigma_k}\ln|\boldsymbol\Sigma_k|+(\mathbf{x}_n-\boldsymbol\mu_k)^{\rm T}\frac{\partial\boldsymbol\Sigma_k^{-1}}{\partial\boldsymbol\Sigma_k}(\mathbf{x}_n-\boldsymbol\mu_k)\right\}\\
&=-\frac{1}{2}\sum_{n=1}^N\gamma(z_{nk})\left\{\boldsymbol\Sigma_k^{-1}-(\mathbf{x}_n-\boldsymbol\mu_k)^{\rm T}\boldsymbol\Sigma_k^{-1}\frac{\partial\boldsymbol\Sigma_k}{\partial\boldsymbol\Sigma_k}\boldsymbol\Sigma_k^{-1}(\mathbf{x}_n-\boldsymbol\mu_k)\right\}\\
&=-\frac{1}{2}\sum_{n=1}^N\gamma(z_{nk})\left\{\boldsymbol\Sigma_k^{-1}-(\mathbf{x}_n-\boldsymbol\mu_k)^{\rm T}\boldsymbol\Sigma_k^{-1}\frac{\partial\boldsymbol\Sigma_k}{\partial\boldsymbol\Sigma_k}\boldsymbol\Sigma_k^{-1}(\mathbf{x}_n-\boldsymbol\mu_k)\right\}\\
&=-\frac{1}{2}\sum_{n=1}^N\gamma(z_{nk})\left\{\boldsymbol\Sigma_k^{-1}-\boldsymbol\Sigma_k^{-1}(\mathbf{x}_n-\boldsymbol\mu_k)(\mathbf{x}_n-\boldsymbol\mu_k)^{\rm T}\boldsymbol\Sigma_k^{-1}\right\}\\
&=-\frac{1}{2}\boldsymbol\Sigma_k^{-1}\sum_{n=1}^N\gamma(z_{nk})\left\{\boldsymbol\Sigma_k-(\mathbf{x}_n-\boldsymbol\mu_k)(\mathbf{x}_n-\boldsymbol\mu_k)^{\rm T}\right\}\boldsymbol\Sigma_k^{-1}\\
&=-\frac{1}{2}\boldsymbol\Sigma_k^{-1}\left\{\left(\sum_{n=1}^N\gamma(z_{nk})\right)\boldsymbol\Sigma_k-\sum_{n=1}^N\gamma(z_{nk})(\mathbf{x}_n-\boldsymbol\mu_k)(\mathbf{x}_n-\boldsymbol\mu_k)^{\rm T}\right\}\boldsymbol\Sigma_k^{-1}\\
&=\mathbf{0}\\
\therefore \boldsymbol\Sigma_k^{\rm new}&=\frac{\sum_{n=1}^N\gamma(z_{nk})(\mathbf{x}_n-\boldsymbol\mu_k)(\mathbf{x}_n-\boldsymbol\mu_k)^{\rm T}}{\sum_{n=1}^N\gamma(z_{nk})}
\end{align*}
$$
Exercise (13.8)
$${\sum_{i=1}^D\mu_{ik}=1}$$より,ラグランジュの未定乗数法を用いて
$$
\begin{align*}
\widetilde{\mathcal{Q}}(\boldsymbol\theta,\boldsymbol\theta^{\rm old})&=\mathcal{Q}(\boldsymbol\theta,\boldsymbol\theta^{\rm old})+\sum_{j=1}^K\lambda_j\left(\sum_{i=1}^D\mu_{ik}-1\right)\\
&=\sum_{n=1}^N\sum_{i=1}^D\sum_{k=1}^K\gamma(z_{nk})x_{ni}\ln\mu_{ik}+\sum_{j=1}^K\lambda_j\left(\sum_{i=1}^D\mu_{ik}-1\right)+({\rm other\ terms})\\
\end{align*}
$$
に対する$${\{\boldsymbol\mu_k\}}$$の最適解を求める。
$$
\begin{align*}
\frac{\partial\widetilde{\mathcal{Q}}(\boldsymbol\theta,\boldsymbol\theta^{\rm old})}{\partial \mu_{ik}}&=\frac{\sum_{n=1}^N\gamma(z_{nk})x_{ni}}{\mu_{ik}}+\lambda_k\\
&=0\\
\therefore \mu_{ik}&=-\frac{\sum_{n=1}^N\gamma(z_{nk})x_{ni}}{\lambda_k}
\end{align*}
$$
得られた解を$${\sum_{i=1}^D\mu_{ik}=1}$$に代入すると,
$$
\begin{align*}
\sum_{i=1}^D\mu_{ik}&=-\frac{\sum_{i=1}^D\sum_{n=1}^Nz_{nk}x_{ni}}{\lambda_k}\\
&=-\frac{\sum_{n=1}^Nz_{nk}\sum_{i=1}^Dx_{ni}}{\lambda_k}\\
&=-\frac{\sum_{n=1}^Nz_{nk}}{\lambda_k}\\
&=1\\
\therefore \lambda_k&=-\sum_{n=1}^Nz_{nk}\\
\therefore \mu_{ik}^{\rm new}&=-\frac{\sum_{n=1}^N\gamma(z_{nk})x_{ni}}{\lambda_k}\\
&=\frac{\sum_{n=1}^N\gamma(z_{nk})x_{ni}}{\sum_{n=1}^Nz_{nk}}
\end{align*}
$$
出力が2変数の場合,いかのようになる。
$$
\begin{align*}
p(x|\mathbf{z})&=\prod_{k=1}^K\left\{\mu_k^{x}(1-\mu_k)^{1-x}\right\}^{z_k}
\\
\therefore \mu_{k}^{\rm new}&=\frac{\sum_{n=1}^N\gamma(z_{nk})x_{n}}{\sum_{n=1}^Nz_{nk}}
\end{align*}
$$
Exercise (13.9)
$${\{\mathbf{x}_1,\cdots,\mathbf{x}_n\},\{\mathbf{x}_{n+1},\cdots,\mathbf{x}_N\}}$$がhead-to-tail nodeである$${\mathbf{z}_n}$$に対して条件付き独立の関係にあるため,
$$
\begin{align*}
p(\mathbf{X}|\mathbf{z}_n)&=p\left(\mathbf{x}_1,\cdots,\mathbf{x}_n,\mathbf{x}_{n+1},\cdots,\mathbf{x}_N|\mathbf{z}_n\right)\\
&=p\left(\mathbf{x}_1,\cdots,\mathbf{x}_n|\mathbf{z}_n\right)p\left(\mathbf{x}_{n+1},\cdots,\mathbf{x}_N|\mathbf{z}_n\right)
\end{align*}
$$
となり,式(13.24)が成立する。
$${\{\mathbf{x}_1,\cdots,\mathbf{x}_{n-1}\},\mathbf{x}_{n}}$$がhead-to-tail nodeである$${\mathbf{z}_n}$$に対して条件付き独立の関係にあるため,
$$
\begin{align*}
p(\mathbf{x}_1,\cdots,\mathbf{x}_{n-1}|\mathbf{x}_n,\mathbf{z}_n)&=\frac{p(\mathbf{x}_1,\cdots,\mathbf{x}_{n-1},\mathbf{x}_n|\mathbf{z}_n)}{p(\mathbf{x}_n|\mathbf{z}_n)}\\
&=\frac{p(\mathbf{x}_1,\cdots,\mathbf{x}_{n-1}|\mathbf{z}_n)p(\mathbf{x}_n|\mathbf{z}_n)}{p(\mathbf{x}_n|\mathbf{z}_n)}\\
&=p(\mathbf{x}_1,\cdots,\mathbf{x}_{n-1}|\mathbf{z}_n)
\end{align*}
$$
となり,式(13.25)が成立する。
$${\{\mathbf{x}_1,\cdots,\mathbf{x}_{n-1}\},\mathbf{z}_{n}}$$がhead-to-tail nodeである$${\mathbf{z}_{n-1}}$$に対して条件付き独立の関係にあるため,
$$
\begin{align*}
p(\mathbf{x}_1,\cdots,\mathbf{x}_{n-1}|\mathbf{z}_{n-1},\mathbf{z}_n)&=\frac{p(\mathbf{x}_1,\cdots,\mathbf{x}_{n-1},\mathbf{z}_n|\mathbf{z}_{n-1})}{p(\mathbf{z}_n|\mathbf{z}_{n-1})}\\
&=\frac{p(\mathbf{x}_1,\cdots,\mathbf{x}_{n-1}|\mathbf{z}_{n-1})p(\mathbf{z}_n|\mathbf{z}_{n-1})}{p(\mathbf{z}_n|\mathbf{z}_{n-1})}\\
&=p(\mathbf{x}_1,\cdots,\mathbf{x}_{n-1}|\mathbf{z}_{n-1})
\end{align*}
$$
となり,式(13.26)が成立する。
$${\{\mathbf{x}_{n+1},\cdots,\mathbf{x}_{N}\},\mathbf{z}_{n}}$$がhead-to-tail nodeである$${\mathbf{z}_{n+1}}$$に対して条件付き独立の関係にあるため,
$$
\begin{align*}
p(\mathbf{x}_{n+1},\cdots,\mathbf{x}_{N}|\mathbf{z}_{n},\mathbf{z}_{n+1})&=\frac{p(\mathbf{x}_{n+1},\cdots,\mathbf{x}_{N},\mathbf{z}_n|\mathbf{z}_{n+1})}{p(\mathbf{z}_n|\mathbf{z}_{n+1})}\\
&=\frac{p(\mathbf{x}_{n+1},\cdots,\mathbf{x}_{N}|\mathbf{z}_{n+1})p(\mathbf{z}_n|\mathbf{z}_{n+1})}{p(\mathbf{z}_n|\mathbf{z}_{n+1})}\\
&=p(\mathbf{x}_{n+1},\cdots,\mathbf{x}_{N}|\mathbf{z}_{n+1})
\end{align*}
$$
となり,式(13.27)が成立する。
$${\{\mathbf{x}_{n+2},\cdots,\mathbf{x}_{N}\},\mathbf{x}_{n+1}}$$がhead-to-tail nodeである$${\mathbf{z}_{n+1}}$$に対して条件付き独立の関係にあるため,
$$
\begin{align*}
p(\mathbf{x}_{n+2},\cdots,\mathbf{x}_{N}|\mathbf{z}_{n+1},\mathbf{x}_{n+1})&=\frac{p(\mathbf{x}_{n+1},\mathbf{x}_{n+2}\cdots,\mathbf{x}_{N}|\mathbf{z}_{n+1})}{p(\mathbf{x}_{n+1}|\mathbf{z}_{n+1})}\\
&=\frac{p(\mathbf{x}_{n+1}|\mathbf{z}_{n+1})p(\mathbf{x}_{n+2}\cdots,\mathbf{x}_{N}|\mathbf{z}_{n+1})}{p(\mathbf{x}_{n+1}|\mathbf{z}_{n+1})}\\
&=p(\mathbf{x}_{n+2}\cdots,\mathbf{x}_{N}|\mathbf{z}_{n+1})
\end{align*}
$$
となり,式(13.28)が成立する。
$${\{\mathbf{x}_{1},\cdots,\mathbf{x}_{n-1}\},\{\mathbf{x}_{n},\cdots,\mathbf{x}_N,\mathbf{z}_n\}}$$がhead-to-tail nodeである$${\mathbf{z}_{n-1}}$$に対して条件付き独立の関係にあるため,
$$
\begin{align*}
p(\mathbf{x}_{1},\cdots,\mathbf{x}_{N}|\mathbf{z}_{n-1},\mathbf{z}_{n})&=\frac{p(\mathbf{x}_{1},\cdots,\mathbf{x}_{n-1},\mathbf{x}_n\cdots\mathbf{x}_{N},\mathbf{z}_n|\mathbf{z}_{n-1})}{p(\mathbf{z}_{n}|\mathbf{z}_{n-1})}\\
&=\frac{p(\mathbf{x}_{1},\cdots,\mathbf{x}_{n-1}|\mathbf{z}_{n-1})p(\mathbf{x}_n\cdots\mathbf{x}_{N},\mathbf{z}_n|\mathbf{z}_{n-1})}{p(\mathbf{z}_{n}|\mathbf{z}_{n-1})}\\
&=p(\mathbf{x}_{1},\cdots,\mathbf{x}_{n-1}|\mathbf{z}_{n-1})p(\mathbf{x}_n\cdots\mathbf{x}_{N}|\mathbf{z}_{n-1},\mathbf{z}_n)
\end{align*}
$$
が成立する。
次に$${\mathbf{x}_n,\{\mathbf{x}_{n+1},\cdots,\mathbf{x}_N\},\mathbf{z}_{n-1}}$$がhead-to-tail nodeである$${\mathbf{z}_{n}}$$に対して条件付き独立の関係であることを考えると,
$$
\begin{align*}
p(\mathbf{x}_n\cdots\mathbf{x}_{N}|\mathbf{z}_{n-1},\mathbf{z}_n)&=\frac{p(\mathbf{x}_n,\mathbf{x}_{n+1}\cdots\mathbf{x}_{N},\mathbf{z}_{n-1}|\mathbf{z}_{n})}{p(\mathbf{z}_{n-1}|\mathbf{z}_{n})}\\
&=\frac{p(\mathbf{x}_n|\mathbf{z}_{n})p(\mathbf{x}_{n+1}\cdots\mathbf{x}_{N}|\mathbf{z}_{n})p(\mathbf{z}_{n-1}|\mathbf{z}_{n})}{p(\mathbf{z}_{n-1}|\mathbf{z}_{n})}\\
&=p(\mathbf{x}_n|\mathbf{z}_{n})p(\mathbf{x}_{n+1}\cdots\mathbf{x}_{N}|\mathbf{z}_{n})
\end{align*}
$$
が得られる。以上より,式(13.29)が成立する。
$${\mathbf{x}_{N+1},\mathbf{X}}$$がhead-to-tail nodeである$${\mathbf{z}_{N+1}}$$に対して条件付き独立の関係にあるため,
$$
\begin{align*}
p(\mathbf{x}_{N+1}|\mathbf{X},\mathbf{z}_{N+1})&=\frac{p(\mathbf{x}_{N+1},\mathbf{X}|\mathbf{z}_{N+1})}{p(\mathbf{X}|\mathbf{z}_{N+1})}\\
&=\frac{p(\mathbf{x}_{N+1}|\mathbf{z}_{N+1})p(\mathbf{X}|\mathbf{z}_{N+1})}{p(\mathbf{X}|\mathbf{z}_{N+1})}\\
&=p(\mathbf{x}_{N+1}|\mathbf{z}_{N+1})
\end{align*}
$$
となり,式(13.30)が成立する。
$${\mathbf{z}_{N+1},\mathbf{X}}$$がhead-to-tail nodeである$${\mathbf{z}_{N}}$$に対して条件付き独立の関係にあるため,
$$
\begin{align*}
p(\mathbf{z}_{N+1}|\mathbf{z}_{N},\mathbf{X})&=\frac{p(\mathbf{z}_{N+1},\mathbf{X}|\mathbf{z}_{N})}{p(\mathbf{X}|\mathbf{z}_{N})}\\
&=\frac{p(\mathbf{z}_{N+1}|\mathbf{z}_{N})p(\mathbf{X}|\mathbf{z}_{N})}{p(\mathbf{X}|\mathbf{z}_{N})}\\
&=p(\mathbf{z}_{N+1}|\mathbf{z}_{N})
\end{align*}
$$
となり,式(13.31)が成立する。
Exercise (13.10)
$$
\begin{align*}
p(\mathbf{X}|\mathbf{z}_n)&=\frac{p(\mathbf{X},\mathbf{z}_n)}{p(\mathbf{z}_n)}\\
&=\frac{\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{n-1}}\sum_{\mathbf{z}_{n+1}}\cdots\sum_{\mathbf{z}_{N}}p(\mathbf{X},\mathbf{Z})}{p(\mathbf{z}_n)}\\
&=\frac{\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{n-1}}\sum_{\mathbf{z}_{n+1}}\cdots\sum_{\mathbf{z}_{N}}p(\mathbf{z}_1)p(\mathbf{x}_1|\mathbf{z}_1)\prod_{n=2}^Np(\mathbf{z}_{n}|\mathbf{z}_{n-1})p(\mathbf{x}_n|\mathbf{z}_n)}{p(\mathbf{z}_n)}\\
&=\left\{\frac{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n-1}\sum_{\mathbf{z}_k}p(\mathbf{z}_{k}|\mathbf{z}_{k-1})p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_{n}|\mathbf{z}_{n-1})p(\mathbf{x}_n|\mathbf{z}_n)}{p(\mathbf{z}_n)}\right\}\left\{\prod_{l=n+1}^{N}\sum_{\mathbf{z}_{l}}p(\mathbf{z}_{l}|\mathbf{z}_{l-1})p(\mathbf{x}_l|\mathbf{z}_l)\right\}\\
\end{align*}
$$
右辺の左側の{}の部分については,$${l=n+1,\cdots,N}$$に対して$${\sum_{\mathbf{z}_l}p(\mathbf{z}_l,\mathbf{z}_{l-1})=1,\ \sum_{\mathbf{x}_l}p(\mathbf{x}_l|\mathbf{z}_{l})=1}$$を利用することにより,
$$
\begin{align*}
\frac{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n-1}\sum_{\mathbf{z}_k}p(\mathbf{z}_{k}|\mathbf{z}_{k-1})p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_{n}|\mathbf{z}_{n-1})p(\mathbf{x}_n|\mathbf{z}_n)}{p(\mathbf{z}_n)}&=\frac{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n-1}\sum_{\mathbf{z}_k}p(\mathbf{z}_{k}|\mathbf{z}_{k-1})p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_{n}|\mathbf{z}_{n-1})p(\mathbf{x}_n|\mathbf{z}_n)\prod_{l=n+1}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_{l}|\mathbf{z}_{l-1})}{p(\mathbf{z}_n)}\\
&=\frac{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n-1}\sum_{\mathbf{z}_k}p(\mathbf{z}_{k}|\mathbf{z}_{k-1})p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_{n}|\mathbf{z}_{n-1})p(\mathbf{x}_n|\mathbf{z}_n)\prod_{l=n+1}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_{l}|\mathbf{z}_{l-1})\sum_{\mathbf{x}_l}p(\mathbf{x}_{l}|\mathbf{z}_{l})}{p(\mathbf{z}_n)}\\
&=\frac{\sum_{\mathbf{x}_{n+1}}\cdots\sum_{\mathbf{x}_{N}}\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{n-1}}\sum_{\mathbf{z}_{n+1}}\cdots\sum_{\mathbf{z}_{N}}p(\mathbf{z}_1)p(\mathbf{x}_1|\mathbf{z}_1)\prod_{n=2}^{N}p(\mathbf{z}_{n}|\mathbf{z}_{n-1})p(\mathbf{x}_n|\mathbf{z}_n)}{p(\mathbf{z}_n)}\\
&=\frac{\sum_{\mathbf{x}_{n+1}}\cdots\sum_{\mathbf{x}_{N}}\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{n-1}}\sum_{\mathbf{z}_{n+1}}\cdots\sum_{\mathbf{z}_{N}}p(\mathbf{X},\mathbf{Z})}{p(\mathbf{z}_n)}\\
&=\frac{p(\mathbf{x}_1,\cdots,\mathbf{x}_n,\mathbf{z}_n)}{p(\mathbf{z}_n)}\\
&=p(\mathbf{x}_1,\cdots,\mathbf{x}_n|\mathbf{z}_n)
\end{align*}
$$
と変形できる。
一方,右辺の右側の{}の部分については,$${l=1,\cdots,n}$$に対して$${ \sum_{\mathbf{x}_l}p(\mathbf{x}_l|\mathbf{z}_{l})=1}$$を利用することにより,
$$
\begin{align*}
\prod_{k=n+1}^{N}\sum_{\mathbf{z}_{k}}p(\mathbf{z}_{k}|\mathbf{z}_{k-1})p(\mathbf{x}_k|\mathbf{z}_k)&=\frac{\prod_{k=n+1}^{N}\sum_{\mathbf{z}_{k}}p(\mathbf{z}_{k}|\mathbf{z}_{k-1})p(\mathbf{x}_k|\mathbf{z}_k)\sum_{\mathbf{z}_1}p(\mathbf{z}_1)\prod_{l=2}^{n-1}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})p(\mathbf{z}_n|\mathbf{z}_{n-1})}{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)\prod_{l=2}^{n-1}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})p(\mathbf{z}_n|\mathbf{z}_{n-1})}\\
&=\frac{\prod_{k=n+1}^{N}\sum_{\mathbf{z}_{k}}p(\mathbf{z}_{k}|\mathbf{z}_{k-1})p(\mathbf{x}_k|\mathbf{z}_k)\sum_{\mathbf{z}_1}p(\mathbf{z}_1)\sum_{\mathbf{x}_1}p(\mathbf{x}_1|\mathbf{z}_1)\prod_{l=2}^{n-1}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})\sum_{\mathbf{x}_l}p(\mathbf{x}_l|\mathbf{z}_l)p(\mathbf{z}_n|\mathbf{z}_{n-1})\sum_{\mathbf{x}_n}p(\mathbf{x}_n|\mathbf{z}_n)}{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)\prod_{l=2}^{n-1}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})p(\mathbf{z}_n|\mathbf{z}_{n-1})}\\
&=\frac{\sum_{\mathbf{x}_{1}}\cdots\sum_{\mathbf{x}_{n}}\sum_{\mathbf{z}_{1}}\cdots\sum_{\mathbf{z}_{n-1}}\sum_{\mathbf{z}_{n+1}}\cdots\sum_{\mathbf{z}_{N}}p(\mathbf{z}_1)p(\mathbf{x}_1|\mathbf{z}_1)\prod_{n=2}^{N}p(\mathbf{z}_n|\mathbf{z}_{n-1})p(\mathbf{x}_n|\mathbf{z}_n)}{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)\prod_{l=2}^{n-1}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})p(\mathbf{z}_n|\mathbf{z}_{n-1})}\\
&=\frac{\sum_{\mathbf{x}_{1}}\cdots\sum_{\mathbf{x}_{n}}\sum_{\mathbf{z}_{1}}\cdots\sum_{\mathbf{z}_{n-1}}\sum_{\mathbf{z}_{n+1}}\cdots\sum_{\mathbf{z}_{N}}p(\mathbf{X}, \mathbf{Z})}{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)\prod_{l=2}^{n-1}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})p(\mathbf{z}_n|\mathbf{z}_{n-1})}\\
&=\frac{p(\mathbf{x}_{n+1},\cdots,\mathbf{x}_{N}, \mathbf{z}_n)}{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)\prod_{l=2}^{n-1}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})p(\mathbf{z}_n|\mathbf{z}_{n-1})}\\
&=\frac{p(\mathbf{x}_{n+1},\cdots,\mathbf{x}_{N}, \mathbf{z}_n)}{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)\prod_{l=2}^{n-1}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})p(\mathbf{z}_n|\mathbf{z}_{n-1})\prod_{k=n+1}^{N}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})}\\
&=\frac{p(\mathbf{x}_{n+1},\cdots,\mathbf{x}_{N}, \mathbf{z}_n)}{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)\sum_{\mathbf{x}_1}p(\mathbf{x}_1|\mathbf{z}_1)\prod_{l=2}^{n-1}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})\sum_{\mathbf{x}_l}p(\mathbf{x}_l|\mathbf{z}_l)p(\mathbf{z}_n|\mathbf{z}_{n-1})\sum_{\mathbf{x}_n}p(\mathbf{x}_n|\mathbf{z}_n)\prod_{k=n+1}^{N}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})\sum_{\mathbf{x}_k}p(\mathbf{x}_k|\mathbf{z}_k)}\\
&=\frac{p(\mathbf{x}_{n+1},\cdots,\mathbf{x}_{N}, \mathbf{z}_n)}{\sum_{\mathbf{x}_1}\cdots\sum_{\mathbf{x}_N}\sum_{\mathbf{z}_1}\sum_{\mathbf{z}_{n-1}}\sum_{\mathbf{z}_{n+1}}\cdots\sum_{\mathbf{z}_{N}}p(\mathbf{X},\mathbf{Z})}\\
&=\frac{p(\mathbf{x}_{n+1},\cdots,\mathbf{x}_{N}, \mathbf{z}_n)}{p(\mathbf{z}_n)}\\
&=p(\mathbf{x}_{n+1},\cdots,\mathbf{x}_{N}, \mathbf{z}_n|\mathbf{z}_n)
\end{align*}
$$
以上より,式(3.24)が得られる。
$$
\begin{align*}
p(\mathbf{x}_1,\cdots,\mathbf{x}_{n-1}|\mathbf{x}_n,\mathbf{z}_n)&=\frac{p(\mathbf{x}_1,\cdots,\mathbf{x}_{n-1},\mathbf{x}_n,\mathbf{z}_n)}{p(\mathbf{x}_n,\mathbf{z}_n)}\\
&=\frac{\sum_{\mathbf{x}_{n+1}}\cdots\sum_{\mathbf{x}_{N}}\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{n-1}}\sum_{\mathbf{z}_{n+1}}\cdots\sum_{\mathbf{z}_{N}}p(\mathbf{X},\mathbf{Z})}{\sum_{\mathbf{x}_1}\cdots\sum_{\mathbf{x}_{n-1}}\sum_{\mathbf{x}_{n+1}}\cdots\sum_{\mathbf{x}_{N}}\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{n-1}}\sum_{\mathbf{z}_{n+1}}\cdots\sum_{\mathbf{z}_{N}}p(\mathbf{X},\mathbf{Z})}\\
&=\frac{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n-1}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_n|\mathbf{z}_{n-1})p(\mathbf{x}_n|\mathbf{z}_n)\prod_{l=n+1}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})\sum_{\mathbf{x}_l}p(\mathbf{x}_l|\mathbf{z}_l)}{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)\sum_{\mathbf{x}_1}p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n-1}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})\sum_{\mathbf{x}_k}p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_n|\mathbf{z}_{n-1})p(\mathbf{x}_n|\mathbf{z}_n)\prod_{l=n+1}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})\sum_{\mathbf{x}_l}p(\mathbf{x}_l|\mathbf{z}_l)}\\
&=\frac{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n-1}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_n|\mathbf{z}_{n-1})\prod_{l=n+1}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})\sum_{\mathbf{x}_l}p(\mathbf{x}_l|\mathbf{z}_l)}{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)\sum_{\mathbf{x}_1}p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n-1}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})\sum_{\mathbf{x}_k}p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_n|\mathbf{z}_{n-1})\prod_{l=n+1}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})\sum_{\mathbf{x}_l}p(\mathbf{x}_l|\mathbf{z}_l)}\\
&=\frac{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n-1}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_n|\mathbf{z}_{n-1})\sum_{\mathbf{x}_n}p(\mathbf{x}_n|\mathbf{z}_n)\prod_{l=n+1}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})\sum_{\mathbf{x}_l}p(\mathbf{x}_l|\mathbf{z}_l)}{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)\sum_{\mathbf{x}_1}p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n-1}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})\sum_{\mathbf{x}_k}p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_n|\mathbf{z}_{n-1})\sum_{\mathbf{x}_n}p(\mathbf{x}_n|\mathbf{z}_n)\prod_{l=n+1}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})\sum_{\mathbf{x}_l}p(\mathbf{x}_l|\mathbf{z}_l)}\\
&=\frac{\sum_{\mathbf{x}_{n}}\cdots\sum_{\mathbf{x}_{N}}\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{n-1}}\sum_{\mathbf{z}_{n+1}}\cdots\sum_{\mathbf{z}_{N}}p(\mathbf{X},\mathbf{Z})}{\sum_{\mathbf{x}_1}\cdots\sum_{\mathbf{x}_{N}}\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{n-1}}\sum_{\mathbf{z}_{n+1}}\cdots\sum_{\mathbf{z}_{N}}p(\mathbf{X},\mathbf{Z})}\\
&=\frac{p(\mathbf{x}_1,\cdots,\mathbf{x}_{n-1},\mathbf{z}_n)}{p(\mathbf{z}_n)}\\
&=p(\mathbf{x}_1,\cdots,\mathbf{x}_{n-1}|\mathbf{z}_n)
\end{align*}
$$
上記の計算において,分子と分母に共通して存在する$${p(\mathbf{x}_n|\mathbf{z}_n)}$$を除算をし,その後$${\sum_{\mathbf{x}_n}p(\mathbf{x}_n|\mathbf{z}_n)(=1)}$$を分子と分母に挿入する手順を行った。
$$
\begin{align*}
p(\mathbf{x}_1,\cdots,\mathbf{x}_{n-1}|\mathbf{z}_{n-1},\mathbf{z}_n)&=\frac{p(\mathbf{x}_1,\cdots,\mathbf{x}_{n-1},\mathbf{z}_{n-1},\mathbf{z}_n)}{p(\mathbf{z}_{n-1},\mathbf{z}_n)}\\
&=\frac{\sum_{\mathbf{x}_{n}}\cdots\sum_{\mathbf{x}_{N}}\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{n-2}}\sum_{\mathbf{z}_{n+1}}\cdots\sum_{\mathbf{z}_{N}}p(\mathbf{X},\mathbf{Z})}{\sum_{\mathbf{x}_1}\cdots\sum_{\mathbf{x}_{N}}\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{n-2}}\sum_{\mathbf{z}_{n+1}}\cdots\sum_{\mathbf{z}_{N}}p(\mathbf{X},\mathbf{Z})}\\
&=\frac{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n-2}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_{n-1}|\mathbf{z}_{n-2})p(\mathbf{x}_{n-1}|\mathbf{z}_{n-1})p(\mathbf{z}_n|\mathbf{z}_{n-1})\sum_{\mathbf{x}_n}p(\mathbf{x}_n|\mathbf{z}_n)\prod_{l=n+1}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})\sum_{\mathbf{x}_l}p(\mathbf{x}_l|\mathbf{z}_l)}{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)\sum_{\mathbf{x}_1}p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n-2}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})\sum_{\mathbf{x}_k}p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_{n-1}|\mathbf{z}_{n-2})\sum_{\mathbf{x}_{n-1}}p(\mathbf{x}_{n-1}|\mathbf{z}_{n-1})p(\mathbf{z}_{n}|\mathbf{z}_{n-1})\sum_{\mathbf{x}_{n}}p(\mathbf{x}_{n}|\mathbf{z}_{n})\prod_{l=n+1}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})\sum_{\mathbf{x}_l}p(\mathbf{x}_l|\mathbf{z}_l)}\\
&=\frac{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n-2}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_{n-1}|\mathbf{z}_{n-2})p(\mathbf{x}_{n-1}|\mathbf{z}_{n-1})\prod_{l=n+1}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})\sum_{\mathbf{x}_l}p(\mathbf{x}_l|\mathbf{z}_l)}{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)\sum_{\mathbf{x}_1}p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n-2}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})\sum_{\mathbf{x}_k}p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_{n-1}|\mathbf{z}_{n-2})\sum_{\mathbf{x}_{n-1}}p(\mathbf{x}_{n-1}|\mathbf{z}_{n-1})\prod_{l=n+1}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})\sum_{\mathbf{x}_l}p(\mathbf{x}_l|\mathbf{z}_l)}\\
&=\frac{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n-2}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_{n-1}|\mathbf{z}_{n-2})p(\mathbf{x}_{n-1}|\mathbf{z}_{n-1})\prod_{l=n}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})\sum_{\mathbf{x}_l}p(\mathbf{x}_l|\mathbf{z}_l)}{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)\sum_{\mathbf{x}_1}p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n-2}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})\sum_{\mathbf{x}_k}p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_{n-1}|\mathbf{z}_{n-2})\sum_{\mathbf{x}_{n-1}}p(\mathbf{x}_{n-1}|\mathbf{z}_{n-1})\prod_{l=n}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})\sum_{\mathbf{x}_l}p(\mathbf{x}_l|\mathbf{z}_l)}\\
&=\frac{\sum_{\mathbf{x}_{n}}\cdots\sum_{\mathbf{x}_{N}}\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{n-2}}\sum_{\mathbf{z}_{n}}\cdots\sum_{\mathbf{z}_{N}}p(\mathbf{X},\mathbf{Z})}{\sum_{\mathbf{x}_1}\cdots\sum_{\mathbf{x}_{N}}\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{n-2}}\sum_{\mathbf{z}_{n}}\cdots\sum_{\mathbf{z}_{N}}p(\mathbf{X},\mathbf{Z})}\\
&=\frac{p(\mathbf{x}_1,\cdots,\mathbf{x}_{n-1},\mathbf{z}_{n-1})}{p(\mathbf{z}_{n-1}))}\\
&=p(\mathbf{x}_1,\cdots,\mathbf{x}_{n-1}|\mathbf{z}_{n-1})
\end{align*}
$$
上記の計算において,分子と分母に共通して存在する$${p(\mathbf{z}_n|\mathbf{z}_{n-1})}$$を除算をし,その後$${\sum_{\mathbf{z}_n}p(\mathbf{z}_n|\mathbf{z}_{n-1})\sum_{\mathbf{x}_n}p(\mathbf{x}_n|\mathbf{z}_{n})}$$を分子と分母に挿入する手順を行った。
$$
\begin{align*}
p(\mathbf{x}_{n+1},\cdots,\mathbf{x}_{N}|\mathbf{z}_{n},\mathbf{z}_{n+1})&=\frac{p(\mathbf{x}_{n+1},\cdots,\mathbf{x}_{N},\mathbf{z}_{n},\mathbf{z}_{n+1})}{p(\mathbf{z}_{n},\mathbf{z}_{n+1})}\\
&=\frac{\sum_{\mathbf{x}_{1}}\cdots\sum_{\mathbf{x}_{n}}\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{n-1}}\sum_{\mathbf{z}_{n+2}}\cdots\sum_{\mathbf{z}_{N}}p(\mathbf{X},\mathbf{Z})}{\sum_{\mathbf{x}_1}\cdots\sum_{\mathbf{x}_{N}}\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{n-1}}\sum_{\mathbf{z}_{n+2}}\cdots\sum_{\mathbf{z}_{N}}p(\mathbf{X},\mathbf{Z})}\\
&=\frac{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n-1}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})\sum_{\mathbf{x}_k}p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_{n}|\mathbf{z}_{n-1})\sum_{\mathbf{x}_n}p(\mathbf{x}_{n}|\mathbf{z}_{n})p(\mathbf{z}_{n+1}|\mathbf{z}_{n})p(\mathbf{x}_{n+1}|\mathbf{z}_{n+1})\prod_{l=n+2}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})p(\mathbf{x}_l|\mathbf{z}_l)}{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n-1}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})\sum_{\mathbf{x}_k}p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_{n}|\mathbf{z}_{n-1})\sum_{\mathbf{x}_n}p(\mathbf{x}_{n}|\mathbf{z}_{n})p(\mathbf{z}_{n+1}|\mathbf{z}_{n})p(\mathbf{x}_{n+1}|\mathbf{z}_{n+1})\prod_{l=n+2}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})\sum_{\mathbf{x}_l}p(\mathbf{x}_l|\mathbf{z}_l)}\\
&=\frac{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n-1}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})\sum_{\mathbf{x}_k}p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_{n+1}|\mathbf{z}_{n})p(\mathbf{x}_{n+1}|\mathbf{z}_{n+1})\prod_{l=n+2}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})p(\mathbf{x}_l|\mathbf{z}_l)}{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n-1}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})\sum_{\mathbf{x}_k}p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_{n+1}|\mathbf{z}_{n})p(\mathbf{x}_{n+1}|\mathbf{z}_{n+1})\prod_{l=n+2}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})\sum_{\mathbf{x}_l}p(\mathbf{x}_l|\mathbf{z}_l)}\\
&=\frac{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})\sum_{\mathbf{x}_k}p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_{n+1}|\mathbf{z}_{n})p(\mathbf{x}_{n+1}|\mathbf{z}_{n+1})\prod_{l=n+2}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})p(\mathbf{x}_l|\mathbf{z}_l)}{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})\sum_{\mathbf{x}_k}p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_{n+1}|\mathbf{z}_{n})p(\mathbf{x}_{n+1}|\mathbf{z}_{n+1})\prod_{l=n+2}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})\sum_{\mathbf{x}_l}p(\mathbf{x}_l|\mathbf{z}_l)}\\
&=\frac{\sum_{\mathbf{x}_{1}}\cdots\sum_{\mathbf{x}_{n}}\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{n-1}}\sum_{\mathbf{z}_{n+1}}\cdots\sum_{\mathbf{z}_{N}}p(\mathbf{X},\mathbf{Z})}{\sum_{\mathbf{x}_1}\cdots\sum_{\mathbf{x}_{N}}\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{n-1}}\sum_{\mathbf{z}_{n+1}}\cdots\sum_{\mathbf{z}_{N}}p(\mathbf{X},\mathbf{Z})}\\
&=\frac{p(\mathbf{x}_{n+1},\cdots,\mathbf{x}_N,\mathbf{z}_{n+1})}{p(\mathbf{z}_{n+1})}\\
&=p(\mathbf{x}_{n+1},\cdots,\mathbf{x}_N|\mathbf{z}_{n+1})
\end{align*}
$$
上記の計算において,分子と分母に共通して存在する$${p(\mathbf{z}_n|\mathbf{z}_{n-1})}$$を除算をし,その後$${\sum_{\mathbf{z}_n}p(\mathbf{z}_n|\mathbf{z}_{n-1})\sum_{\mathbf{x}_n}p(\mathbf{x}_n|\mathbf{z}_{n})}$$を分子と分母に挿入する手順を行った。
$$
\begin{align*}
p(\mathbf{x}_{n+2},\cdots,\mathbf{x}_{N}|\mathbf{z}_{n+1},\mathbf{x}_{n+1})&=\frac{p(\mathbf{x}_{n+1},\cdots,\mathbf{x}_{N},\mathbf{z}_{n+1})}{p(\mathbf{z}_{n+1},\mathbf{x}_{n+1})}\\
&=\frac{\sum_{\mathbf{x}_{1}}\cdots\sum_{\mathbf{x}_{n}}\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{n}}\sum_{\mathbf{z}_{n+2}}\cdots\sum_{\mathbf{z}_{N}}p(\mathbf{X},\mathbf{Z})}{\sum_{\mathbf{x}_1}\cdots\sum_{\mathbf{x}_{n}}\sum_{\mathbf{x}_{n+2}}\cdots\sum_{\mathbf{x}_{N}}\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{n}}\sum_{\mathbf{z}_{n+2}}\cdots\sum_{\mathbf{z}_{N}}p(\mathbf{X},\mathbf{Z})}\\
&=\frac{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)\sum_{\mathbf{x}_1}p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})\sum_{\mathbf{x}_k}p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_{n+1}|\mathbf{z}_{n})p(\mathbf{x}_{n+1}|\mathbf{z}_{n+1})\prod_{l=n+2}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})p(\mathbf{x}_l|\mathbf{z}_l)}{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)\sum_{\mathbf{x}_1}p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})\sum_{\mathbf{x}_k}p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_{n+1}|\mathbf{z}_{n})p(\mathbf{x}_{n+1}|\mathbf{z}_{n+1})\prod_{l=n+2}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})\sum_{\mathbf{x}_l}p(\mathbf{x}_l|\mathbf{z}_l)}\\
&=\frac{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)\sum_{\mathbf{x}_1}p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})\sum_{\mathbf{x}_k}p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_{n+1}|\mathbf{z}_{n})\prod_{l=n+2}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})p(\mathbf{x}_l|\mathbf{z}_l)}{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)\sum_{\mathbf{x}_1}p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})\sum_{\mathbf{x}_k}p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_{n+1}|\mathbf{z}_{n})\prod_{l=n+2}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})\sum_{\mathbf{x}_l}p(\mathbf{x}_l|\mathbf{z}_l)}\\
&=\frac{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)\sum_{\mathbf{x}_1}p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})\sum_{\mathbf{x}_k}p(\mathbf{x}_k|\mathbf{z}_k)\sum_{\mathbf{x}_{n+1}}p(\mathbf{z}_{n+1}|\mathbf{z}_{n})p(\mathbf{x}_{n+1}|\mathbf{z}_{n+1})\prod_{l=n+2}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})p(\mathbf{x}_l|\mathbf{z}_l)}{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)\sum_{\mathbf{x}_1}p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})\sum_{\mathbf{x}_k}p(\mathbf{x}_k|\mathbf{z}_k)\sum_{\mathbf{x}_{n+1}}p(\mathbf{z}_{n+1}|\mathbf{z}_{n})p(\mathbf{x}_{n+1}|\mathbf{z}_{n+1})\prod_{l=n+2}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})\sum_{\mathbf{x}_l}p(\mathbf{x}_l|\mathbf{z}_l)}\\
&=\frac{\sum_{\mathbf{x}_{1}}\cdots\sum_{\mathbf{x}_{n+1}}\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{n}}\sum_{\mathbf{z}_{n+2}}\cdots\sum_{\mathbf{z}_{N}}p(\mathbf{X},\mathbf{Z})}{\sum_{\mathbf{x}_1}\cdots\sum_{\mathbf{x}_{N}}\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{n}}\sum_{\mathbf{z}_{n+2}}\cdots\sum_{\mathbf{z}_{N}}p(\mathbf{X},\mathbf{Z})}\\
&=\frac{p(\mathbf{x}_{n+2}\cdots,\mathbf{x}_N,\mathbf{z}_{n+1})}{p(\mathbf{z}_{n+1})}\\
&=p(\mathbf{x}_{n+2}\cdots,\mathbf{x}_N|\mathbf{z}_{n+1})
\end{align*}
$$
上記の計算において,分子と分母に共通して存在する$${p(\mathbf{x}_{n+1}|\mathbf{z}_{n+1})}$$を除算をし,その後$${\sum_{\mathbf{x}_{n+1}}p(\mathbf{x}_{n+1}|\mathbf{z}_{n+1})}$$を分子と分母に挿入する手順を行った。
$$
\begin{align*}
p(\mathbf{X}|\mathbf{z}_{n-1},\mathbf{z}_{n})&=\frac{p(\mathbf{X},\mathbf{z}_{n-1},\mathbf{z}_{n})}{p(\mathbf{z}_{n}|\mathbf{z}_{n-1})p(\mathbf{z}_{n-1})}\\
&=\frac{\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{n-2}}\sum_{\mathbf{z}_{n+1}}\cdots\sum_{\mathbf{z}_{N}}p(\mathbf{X},\mathbf{Z})}{p(\mathbf{z}_{n}|\mathbf{z}_{n-1})p(\mathbf{z}_{n-1})}\\
&=\frac{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n-2}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_{n-1}|\mathbf{z}_{n-2})p(\mathbf{x}_{n-1}|\mathbf{z}_{n-1})p(\mathbf{z}_{n}|\mathbf{z}_{n-1})p(\mathbf{x}_{n}|\mathbf{z}_{n})\prod_{l=n+1}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})p(\mathbf{x}_l|\mathbf{z}_l)}{p(\mathbf{z}_{n}|\mathbf{z}_{n-1})p(\mathbf{z}_{n-1})}\\
&=\frac{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n-2}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_{n-1}|\mathbf{z}_{n-2})p(\mathbf{x}_{n-1}|\mathbf{z}_{n-1})p(\mathbf{x}_{n}|\mathbf{z}_{n})\prod_{l=n+1}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})p(\mathbf{x}_l|\mathbf{z}_l)}{p(\mathbf{z}_{n-1})}\\
&=\frac{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n-2}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_{n-1}|\mathbf{z}_{n-2})p(\mathbf{x}_{n-1}|\mathbf{z}_{n-1})}{p(\mathbf{z}_{n-1})}*p(\mathbf{x}_{n}|\mathbf{z}_{n})*\left\{\prod_{l=n+1}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})p(\mathbf{x}_l|\mathbf{z}_l)\right\}\\
&=\frac{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n-2}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_{n-1}|\mathbf{z}_{n-2})p(\mathbf{x}_{n-1}|\mathbf{z}_{n-1})}{p(\mathbf{z}_{n-1})}*p(\mathbf{x}_{n}|\mathbf{z}_{n})*p(\mathbf{x}_{n+1},\cdots,\mathbf{x}_N|\mathbf{z}_n)\\
&=\frac{\sum_{\mathbf{z}_1}p(\mathbf{z}_1)p(\mathbf{x}_1|\mathbf{z}_1)\prod_{k=2}^{n-2}\sum_{\mathbf{z}_k}p(\mathbf{z}_k|\mathbf{z}_{k-1})p(\mathbf{x}_k|\mathbf{z}_k)p(\mathbf{z}_{n-1}|\mathbf{z}_{n-2})p(\mathbf{x}_{n-1}|\mathbf{z}_{n-1})\prod_{l=n}^{N}\sum_{\mathbf{z}_l}p(\mathbf{z}_l|\mathbf{z}_{l-1})\sum_{\mathbf{x}_l}p(\mathbf{x}_l|\mathbf{z}_l)}{p(\mathbf{z}_{n-1})}*p(\mathbf{x}_{n}|\mathbf{z}_{n})*p(\mathbf{x}_{n+1},\cdots,\mathbf{x}_N|\mathbf{z}_n)\\
&=\frac{\sum_{\mathbf{x}_n}\cdots\sum_{\mathbf{x}_N}\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{n-2}}\sum_{\mathbf{z}_{n}}\cdots\sum_{\mathbf{z}_N}p(\mathbf{X},\mathbf{Z})}{p(\mathbf{z}_{n-1})}*p(\mathbf{x}_{n}|\mathbf{z}_{n})*p(\mathbf{x}_{n+1},\cdots,\mathbf{x}_N|\mathbf{z}_n)\\
&=\frac{p(\mathbf{x}_1,\cdots,\mathbf{x}_{n-1},\mathbf{z}_{n-1})}{p(\mathbf{z}_{n-1})}*p(\mathbf{x}_{n}|\mathbf{z}_{n})*p(\mathbf{x}_{n+1},\cdots,\mathbf{x}_N|\mathbf{z}_n)\\
&=p(\mathbf{x}_1,\cdots,\mathbf{x}_{n-1}|\mathbf{z}_{n-1})*p(\mathbf{x}_{n}|\mathbf{z}_{n})*p(\mathbf{x}_{n+1},\cdots,\mathbf{x}_N|\mathbf{z}_n)\\
\end{align*}
$$
$$
\begin{align*}
p(\mathbf{x}_{N+1}|\mathbf{X},\mathbf{z}_{N+1})&=\frac{p(\mathbf{x}_{N+1},\mathbf{X},\mathbf{z}_{N+1})}{p(\mathbf{X},\mathbf{z}_{N+1})}\\
&=\frac{\sum_{\mathbf{Z}}p(\mathbf{x}_{N+1},\mathbf{X},\mathbf{z}_{N+1},\mathbf{Z})}{\sum_{\mathbf{Z}}\sum_{\mathbf{x}_{N+1}}p(\mathbf{x}_{N+1},\mathbf{X},\mathbf{z}_{N+1},\mathbf{Z})}\\
&=\frac{\sum_{\mathbf{Z}}p(\mathbf{X},\mathbf{Z})p(\mathbf{z}_{N+1}|\mathbf{z}_N)p(\mathbf{x}_{N+1}|\mathbf{z}_{N+1})}{\sum_{\mathbf{Z}}p(\mathbf{X},\mathbf{Z})p(\mathbf{z}_{N+1}|\mathbf{z}_N)\sum_{\mathbf{x}_{N+1}}p(\mathbf{x}_{N+1}|\mathbf{z}_{N+1})}\\
&=\frac{\sum_{\mathbf{Z}}p(\mathbf{X},\mathbf{Z})p(\mathbf{z}_{N+1}|\mathbf{z}_N)p(\mathbf{x}_{N+1}|\mathbf{z}_{N+1})}{\sum_{\mathbf{Z}}p(\mathbf{X},\mathbf{Z})p(\mathbf{z}_{N+1}|\mathbf{z}_N)}\\
&=\frac{\sum_{\mathbf{Z}}p(\mathbf{X},\mathbf{Z})p(\mathbf{z}_{N+1}|\mathbf{z}_N)}{\sum_{\mathbf{Z}}p(\mathbf{X},\mathbf{Z})p(\mathbf{z}_{N+1}|\mathbf{z}_N)}p(\mathbf{x}_{N+1}|\mathbf{z}_{N+1})\\
&=p(\mathbf{x}_{N+1}|\mathbf{z}_{N+1})
\end{align*}
$$
$$
\begin{align*}
p(\mathbf{z}_{N+1}|\mathbf{z}_{N}, \mathbf{X})&=\frac{p(\mathbf{z}_{N+1},\mathbf{X},\mathbf{z}_{N})}{p(\mathbf{X},\mathbf{z}_{N})}\\
&=\frac{\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{N-1}}p(\mathbf{X},\mathbf{z}_{N+1},\mathbf{Z})}{\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{N-1}}\sum_{\mathbf{z}_{N+1}}p(\mathbf{X},\mathbf{z}_{N+1},\mathbf{Z})}\\
&=\frac{\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{N-1}}p(\mathbf{X},\mathbf{Z})p(\mathbf{z}_{N+1}|\mathbf{z}_N)}{\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{N-1}}p(\mathbf{X},\mathbf{Z})\sum_{\mathbf{z}_{N+1}}p(\mathbf{z}_{N+1}|\mathbf{z}_N)}\\
&=\frac{\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{N-1}}p(\mathbf{X},\mathbf{Z})p(\mathbf{z}_{N+1}|\mathbf{z}_N)}{\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{N-1}}p(\mathbf{X},\mathbf{Z})}\\
&=\frac{\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{N-1}}p(\mathbf{X},\mathbf{Z})}{\sum_{\mathbf{z}_1}\cdots\sum_{\mathbf{z}_{N-1}}p(\mathbf{X},\mathbf{Z})}p(\mathbf{z}_{N+1}|\mathbf{z}_N)\\
&=p(\mathbf{z}_{N+1}|\mathbf{z}_N)
\end{align*}
$$
Exercise (13.11) - (13.20)
Exercise (13.11)
式(8.72)を用いて$${p(\mathbf{z}_{n-1},\mathbf{z}_{n}, \mathbf{X})}$$を計算すると,
$$
\begin{align*}
p(\mathbf{z}_{n-1},\mathbf{z}_{n}, \mathbf{X})&=f_n(\mathbf{z}_{n-1},\mathbf{z}_{n})\mu_{\mathbf{z}_n\rightarrow f_n}(\mathbf{z}_n)\mu_{\mathbf{z}_{n-1}\rightarrow f_n}(\mathbf{z}_{n-1})\\
&=f_n(\mathbf{z}_{n-1},\mathbf{z}_{n})\mu_{ f_{n+1}\rightarrow \mathbf{z}_n}(\mathbf{z}_n)\mu_{ f_{n-1}\rightarrow\mathbf{z}_{n-1}}(\mathbf{z}_{n-1})\\
&=f_n(\mathbf{z}_{n-1},\mathbf{z}_{n})\beta(\mathbf{z}_n)\alpha(\mathbf{z}_{n-1})\\
&=\alpha(\mathbf{z}_{n-1})f_n(\mathbf{z}_{n-1},\mathbf{z}_{n})\beta(\mathbf{z}_n)\\
&=\alpha(\mathbf{z}_{n-1})p(\mathbf{x}_n|\mathbf{z}_n)p(\mathbf{z}_n|\mathbf{z}_{n-1})\beta(\mathbf{z}_n)\\
\therefore \xi(\mathbf{z}_{n-1},\mathbf{z}_{n})&=p(\mathbf{z}_{n-1},\mathbf{z}_{n}| \mathbf{X})\\
&=\frac{p(\mathbf{z}_{n-1},\mathbf{z}_{n}, \mathbf{X})}{p(\mathbf{X})}\\
&=\frac{\alpha(\mathbf{z}_{n-1})p(\mathbf{x}_n|\mathbf{z}_n)p(\mathbf{z}_n|\mathbf{z}_{n-1})\beta(\mathbf{z}_n)}{p(\mathbf{X})}
\end{align*}
$$
Exercise (13.12)
$${\{\mathbf{X}^{(r)}\ (\ r=1,\cdots,R)\}}$$がそれぞれ独立しているとき,
$$
\begin{align*}
\gamma(\mathbf{z}_n^{(r)})&=p(\mathbf{z}_{n}^{(r)}|\mathbf{X}^{(1)},\cdots,\mathbf{X}^{(R)})\\
&=\frac{p(\mathbf{z}_{n}^{(r)},\mathbf{X}^{(1)},\cdots,\mathbf{X}^{(R)})}{p(\mathbf{X}^{(1)},\cdots,\mathbf{X}^{(R)})}\\
&=\frac{p(\mathbf{z}_{n}^{(r)},\mathbf{X}^{(1)},\cdots,\mathbf{X}^{(R)})}{\prod_{r=1}^Rp(\mathbf{X}^{(r)})}\\
&=\frac{p(\mathbf{z}_{n}^{(r)})\prod_{r'=1}^Rp(\mathbf{X}^{(r')}|\mathbf{z}_{n}^{(r)})}{\prod_{r=1}^Rp(\mathbf{X}^{(r)})}\\
&=\frac{p(\mathbf{z}_{n}^{(r)})p(\mathbf{X}^{(r)}|\mathbf{z}_{n}^{(r)})\prod_{r'\neq r}^Rp(\mathbf{X}^{(r')})}{\prod_{r=1}^Rp(\mathbf{X}^{(r)})}\\
&=\frac{p(\mathbf{z}_{n}^{(r)})p(\mathbf{X}^{(r)}|\mathbf{z}_{n}^{(r)})}{p(\mathbf{X}^{(r)})}\\
&=p(\mathbf{z}_{n}^{(r)}|\mathbf{X}^{(r)})
\end{align*}
$$
となり,各$${\mathbf{z}_n^{(r)}}$$は$${\mathbf{X}^{(r)}}$$のみを用いて評価できる。
$${\xi(\mathbf{z}_{n-1}^{(r)},\mathbf{z}_n^{(r)})}$$も同様にして,
$$
\begin{align*}
\xi(\mathbf{z}_{n-1}^{(r)},\mathbf{z}_n^{(r)})&=p(\mathbf{z}_{n-1}^{(r)},\mathbf{z}_{n}^{(r)}|\mathbf{X}^{(1)},\cdots,\mathbf{X}^{(R)})\\
&=\frac{p(\mathbf{z}_{n-1}^{(r)},\mathbf{z}_{n}^{(r)},\mathbf{X}^{(1)},\cdots,\mathbf{X}^{(R)})}{p(\mathbf{X}^{(1)},\cdots,\mathbf{X}^{(R)})}\\
&=\frac{p(\mathbf{z}_{n-1}^{(r)},\mathbf{z}_{n}^{(r)},\mathbf{X}^{(1)},\cdots,\mathbf{X}^{(R)})}{\prod_{r=1}^Rp(\mathbf{X}^{(r)})}\\
&=\frac{p(\mathbf{z}_{n-1}^{(r)},\mathbf{z}_{n}^{(r)})\prod_{r'=1}^Rp(\mathbf{X}^{(r')}|\mathbf{z}_{n-1}^{(r)},\mathbf{z}_{n}^{(r)})}{\prod_{r=1}^Rp(\mathbf{X}^{(r)})}\\
&=\frac{p(\mathbf{z}_{n-1}^{(r)},\mathbf{z}_{n}^{(r)})p(\mathbf{X}^{(r)}|\mathbf{z}_{n-1}^{(r)},\mathbf{z}_{n}^{(r)})\prod_{r'\neq r}^Rp(\mathbf{X}^{(r')})}{\prod_{r=1}^Rp(\mathbf{X}^{(r)})}\\
&=\frac{p(\mathbf{z}_{n-1}^{(r)},\mathbf{z}_{n}^{(r)})p(\mathbf{X}^{(r)}|\mathbf{z}_{n-1}^{(r)},\mathbf{z}_{n}^{(r)})}{p(\mathbf{X}^{(r)})}\\
&=p(\mathbf{z}_{n-1}^{(r)},\mathbf{z}_{n}^{(r)}|\mathbf{X}^{(r)})
\end{align*}
$$
となり,$${\mathbf{X}^{(r)}}$$のみを用いて評価できる。
$${\mathcal{Q}\left(\boldsymbol\theta,\boldsymbol\theta^{\rm old}\right)}$$は
$$
\begin{align*}
\mathcal{Q}\left(\boldsymbol\theta,\boldsymbol\theta^{\rm old}\right)&=\mathbb{E}\left[\ln p\left(\left.\left\{\mathbf{X}^{(r)}\right\},\left\{\mathbf{Z}^{(r)}\right\}\right|\boldsymbol\theta\right) \right]\\
&=\sum_{r=1}^R\mathbb{E}\left[\ln p\left(\left.\mathbf{X}^{(r)},\mathbf{Z}^{(r)}\right|\boldsymbol\theta\right) \right]\\
&=\sum_{r=1}^R\mathbb{E}\left[\ln p\left(\mathbf{z}_1^{(r)}|\boldsymbol\pi\right) + \sum_{n=2}^N\ln p\left(\mathbf{z}_n^{(r)}\left|\mathbf{z}_{n-1}^{(r)},\mathbf{A}\right.\right)+ \sum_{n=1}^N\ln p\left(\mathbf{x}_n^{(r)}|\mathbf{z}_n^{(r)}, \boldsymbol\theta\right)\right]\\
&=\sum_{r=1}^R\left\{\sum_{k=1}^K\mathbb{E}\left[z_{1k}^{(r)}\right]\ln\pi_k + \sum_{n=2}^N\sum_{k=1}^K\sum_{j=1}^K\mathbb{E}\left[z_{n-1,j}^{(r)}z_{nk}^{(r)}\right]\ln A_{jk}+ \sum_{n=1}^N\sum_{k=1}^K\mathbb{E}\left[z_{nk}^{(r)}\right]\ln p\left(\mathbf{x}_n^{(r)}| \boldsymbol\phi_k\right)\right\}\\
&=\sum_{r=1}^R\left\{\sum_{k=1}^K\gamma\left(z_{1k}^{(r)}\right)\ln\pi_k + \sum_{n=2}^N\sum_{k=1}^K\sum_{j=1}^K\xi\left(z_{n-1,j}^{(r)}z_{nk}^{(r)}\right)\ln A_{jk}+ \sum_{n=1}^N\sum_{k=1}^K\gamma\left(z_{nk}^{(r)}\right)\ln p\left(\mathbf{x}_n^{(r)}| \boldsymbol\phi_k\right)\right\}\\
\end{align*}
$$
で与えられる。
$$
\begin{align*}
\widetilde{\mathcal{Q}}\left(\boldsymbol\theta,\boldsymbol\theta^{\rm old}\right)&=\sum_{r=1}^R\sum_{k=1}^K\gamma\left(z_{1k}^{(r)}\right)\ln\pi_k+\lambda\left(\sum_{k=1}^K\pi_k-1\right)+{\rm (other\ terms)}\\
\end{align*}
$$
に対して$${\pi_k}$$の最適解を求めると,
$$
\begin{align*}
\frac{\partial}{\partial \pi_k}\widetilde{\mathcal{Q}}\left(\boldsymbol\theta,\boldsymbol\theta^{\rm old}\right)&=\sum_{r=1}^R\gamma\left(z_{1k}^{(r)}\right)\frac{1}{\pi_k}+\lambda\\
&=0\\
\therefore \pi_k&=-\frac{\sum_{r=1}^R\gamma\left(z_{1k}^{(r)}\right)}{\lambda}
\end{align*}
$$
$${\{\pi_k\}}$$の規格化条件より,
$$
\begin{align*}
\sum_{k=1}^K\pi_k&=-\frac{\sum_{r=1}^R\sum_{k=1}^K\gamma\left(z_{1k}^{(r)}\right)}{\lambda}\\
&=1\\
\therefore \lambda&=-\sum_{r=1}^R\sum_{k=1}^K\gamma\left(z_{1k}^{(r)}\right)\\
\therefore \pi_k^{\rm new}&=-\frac{\sum_{r=1}^R\gamma\left(z_{1k}^{(r)}\right)}{\lambda}\\
&=\frac{\sum_{r=1}^R\gamma\left(z_{1k}^{(r)}\right)}{\sum_{r=1}^R\sum_{j=1}^K\gamma\left(z_{1j}^{(r)}\right)}
\end{align*}
$$
$$
\begin{align*}
\widetilde{\mathcal{Q}}\left(\boldsymbol\theta,\boldsymbol\theta^{\rm old}\right)&=\sum_{r=1}^R\sum_{n=2}^N\sum_{k=1}^K\sum_{j=1}^K\xi\left(z_{n-1,j}^{(r)}z_{nk}^{(r)}\right)\ln A_{jk}+\sum_{j=1}^K\lambda_j\left(\sum_{k=1}^KA_{jk}-1\right)+{\rm (other\ terms)}\\
\end{align*}
$$
に対して$${A_{jk}}$$の最適解を求めると,
$$
\begin{align*}
\frac{\partial}{\partial A_{jk}}\widetilde{\mathcal{Q}}\left(\boldsymbol\theta,\boldsymbol\theta^{\rm old}\right)&=\sum_{r=1}^R\sum_{n=2}^N\xi\left(z_{n-1,j}^{(r)}z_{nk}^{(r)}\right)\frac{1}{A_{jk}}+\lambda_j\\
&=0\\
\therefore A_{jk}&=-\frac{\sum_{r=1}^R\sum_{n=2}^N\xi\left(z_{n-1,j}^{(r)}z_{nk}^{(r)}\right)}{\lambda_j}
\end{align*}
$$
$${\{A_{jk}\}}$$の規格化条件より,
$$
\begin{align*}
\sum_{k=1}^KA_{jk}&=-\frac{\sum_{r=1}^R\sum_{k=1}^K\sum_{n=2}^N\xi\left(z_{n-1,j}^{(r)}z_{nk}^{(r)}\right)}{\lambda_j}\\
&=1\\
\therefore \lambda&=-\sum_{r=1}^R\sum_{k=1}^K\sum_{n=2}^N\xi\left(z_{n-1,j}^{(r)}z_{nk}^{(r)}\right)\\
\therefore A_{jk}^{\rm new}&=-\frac{\sum_{r=1}^R\sum_{n=2}^N\xi\left(z_{n-1,j}^{(r)}z_{nk}^{(r)}\right)}{\lambda_j}\\
&=\frac{\sum_{r=1}^R\sum_{n=2}^N\xi\left(z_{n-1,j}^{(r)}z_{nk}^{(r)}\right)}{\sum_{r=1}^R\sum_{l=1}^K\sum_{n=2}^N\xi\left(z_{n-1,j}^{(r)}z_{nl}^{(r)}\right)}
\end{align*}
$$
$${p\left(\left.\mathbf{x}_n^{(r)}\right| \boldsymbol\phi_k\right)=\mathcal{N}\left(\left.\mathbf{x}_n^{(r)}\right|\boldsymbol\mu_k,\boldsymbol\Sigma_k\right)}$$のとき,$${\mathcal{Q}(\boldsymbol\theta,\boldsymbol\theta^{\rm old})}$$に対する$${\boldsymbol\mu_k}$$の最適解を求めると,
$$
\begin{align*}
\frac{\partial}{\partial \boldsymbol\mu_k}\mathcal{Q}\left(\boldsymbol\theta,\boldsymbol\theta^{\rm old}\right)&=\sum_{r=1}^R\sum_{n=1}^N\gamma\left(z_{nk}^{(r)}\right)\boldsymbol\Sigma_k^{-1}\left(\mathbf{x}_n^{(r)}-\boldsymbol\mu_k\right)\\
&=\mathbf{0}\\
\sum_{r=1}^R\sum_{n=1}^N\gamma\left(z_{nk}^{(r)}\right)\left(\mathbf{x}_n^{(r)}-\boldsymbol\mu_k\right)&=\mathbf{0}\\
\therefore \boldsymbol\mu_k^{\rm new}&=\frac{\sum_{r=1}^R\sum_{n=1}^N\gamma\left(z_{nk}^{(r)}\right)\mathbf{x}_n^{(r)}}{\sum_{r=1}^R\sum_{n=1}^N\gamma\left(z_{nk}^{(r)}\right)}
\end{align*}
$$
Exercise (13.13)
式(8.64)に従って式(13.50)を展開すると,
$$
\begin{align*}
\alpha(\mathbf{z}_n)&=\mu_{f_n\rightarrow\mathbf{z}_n}(\mathbf{z}_n)\\
&=\sum_{\mathbf{z}_{1}}\cdots\sum_{\mathbf{z}_{n-1}}F_n(\mathbf{z}_n,\{\mathbf{z}_1,\mathbf{z}_{n-1}\})\\
&=\sum_{\mathbf{z}_{1}}\cdots\sum_{\mathbf{z}_{n-1}}h(\mathbf{z}_1)\prod_{i=2}^n f_{i}(\mathbf{z}_{i-1},\mathbf{z}_{i})\\
&=\sum_{\mathbf{z}_{1}}\cdots\sum_{\mathbf{z}_{n-1}}p(\mathbf{z}_1)\left[\prod_{i=2}^{n}p(\mathbf{z}_i|\mathbf{z}_{i-1})\right]\prod_{j=2}^{n}p(\mathbf{x}_j|\mathbf{z}_j)\\
&=\sum_{\mathbf{z}_{1}}\cdots\sum_{\mathbf{z}_{n-1}}p(\mathbf{x}_1,\cdots \mathbf{x}_n,\mathbf{z}_1,\cdots,\mathbf{z}_n)\\
&=p(\mathbf{x}_1,\cdots \mathbf{x}_n,\mathbf{z}_n)
\end{align*}
$$
となり,式(13.34)と同じ表式が得られる。
Exercise (13.14)
式(8.67)に従って式(13.52)を展開すると,
$$
\begin{align*}
\beta(\mathbf{z}_n)&=\mu_{f_{n+1}\rightarrow\mathbf{z}_n}(\mathbf{z}_n)\\
&=\sum_{\mathbf{z}_{n+1}}\cdots\sum_{\mathbf{z}_{Z}}G_n(\mathbf{z}_n,\{\mathbf{z}_{n+1},\mathbf{z}_{N}\})\\
&=\sum_{\mathbf{z}_{n+1}}\cdots\sum_{\mathbf{z}_{Z}}F_{n+1}(\mathbf{z}_n,\{\mathbf{z}_{n+1},\mathbf{z}_{N}\})\\
&=\sum_{\mathbf{z}_{n+1}}\cdots\sum_{\mathbf{z}_{Z}}\prod_{k=n+1}f_{k}(\mathbf{z}_{k-1},\mathbf{z}_{k})\\
&=\prod_{k=n+1}^{N}\sum_{\mathbf{z}_{k}}p(\mathbf{z}_k|\mathbf{z}_{k-1})p(\mathbf{x}_k|\mathbf{z}_k)\\
&=p(\mathbf{x}_{n+1},\cdots \mathbf{x}_N|\mathbf{z}_n)
\end{align*}
$$
となり,式(13.35)と同じ表式が得られる。
最後の式変形においては,Exercise (13.10)で得られた結果を利用した。
Exercise (13.15)
$$
\begin{align*}
\gamma(\mathbf{z}_n)&=\frac{\alpha(\mathbf{z}_n)\beta(\mathbf{z}_n)}{p(\mathbf{X})}\\
&=\frac{\alpha(\mathbf{z}_n)\beta(\mathbf{z}_n)}{\prod_{m=1}^Nc_m}\\
&=\left\{\frac{\alpha(\mathbf{z}_n)}{\prod_{m=1}^nc_m}\right\}\left\{\frac{\beta(\mathbf{z}_n)}{\prod_{m=n+1}^Nc_m}\right\}\\
&=\widehat{\alpha}(\mathbf{z}_n)\widehat{\beta}(\mathbf{z}_n)\\
\xi(\mathbf{z}_{n-1},\mathbf{z}_n)&=\frac{\alpha(\mathbf{z}_{n-1})p(\mathbf{x}_n|\mathbf{z}_n)p(\mathbf{z}_n|\mathbf{z}_{n-1})\beta(\mathbf{z}_n)}{p(\mathbf{X})}\\
&=\frac{\alpha(\mathbf{z}_{n-1})p(\mathbf{x}_n|\mathbf{z}_n)p(\mathbf{z}_n|\mathbf{z}_{n-1})\beta(\mathbf{z}_n)}{p(\mathbf{X})}\\
&=\frac{\alpha(\mathbf{z}_{n-1})p(\mathbf{x}_n|\mathbf{z}_n)p(\mathbf{z}_n|\mathbf{z}_{n-1})\beta(\mathbf{z}_n)}{\prod_{l=1}^{n-1}c_lc_n\prod_{m=n+1}^{N}c_m}\\
&=\frac{1}{c_n}\left\{\frac{\alpha(\mathbf{z}_{n-1})}{\prod_{l=1}^{n-1}c_l}\right\}p(\mathbf{x}_n|\mathbf{z}_n)p(\mathbf{z}_n|\mathbf{z}_{n-1})\left\{\frac{\beta(\mathbf{z}_n)}{\prod_{m=n+1}^{N}c_m}\right\}\\
&=\frac{1}{c_n}\widehat{\alpha}(\mathbf{z}_{n-1})p(\mathbf{x}_n|\mathbf{z}_n)p(\mathbf{z}_n|\mathbf{z}_{n-1})\widehat{\beta}(\mathbf{z}_n)
\end{align*}
$$
Exercise (13.16)
$$
\begin{align*}
\omega(\mathbf{z}_{n+1})&=\max_{\mathbf{z}_1,\cdots,\mathbf{z}_n}\left\{\ln p(\mathbf{x}_1, \cdots, \mathbf{x}_{n+1},\mathbf{z}_1, \cdots, \mathbf{z}_{n+1})\right\}\\
&=\max_{\mathbf{z}_1,\cdots,\mathbf{z}_n}\left\{\ln p(\mathbf{x}_1, \cdots, \mathbf{x}_{n},\mathbf{z}_1, \cdots, \mathbf{z}_{n})+\ln p(\mathbf{x}_{n+1}|\mathbf{z}_{n+1})+\ln p(\mathbf{z}_{n+1}|\mathbf{z}_n)\right\}\\
&=\ln p(\mathbf{x}_{n+1}|\mathbf{z}_{n+1})+\max_{\mathbf{z}_1,\cdots,\mathbf{z}_n}\left\{\ln p(\mathbf{z}_{n+1}|\mathbf{z}_n)+\ln p(\mathbf{x}_1, \cdots, \mathbf{x}_{n},\mathbf{z}_1, \cdots, \mathbf{z}_{n})\right\}\\
&=\ln p(\mathbf{x}_{n+1}|\mathbf{z}_{n+1})+\max_{\mathbf{z}_1,\cdots,\mathbf{z}_n}\left\{\ln p(\mathbf{z}_{n+1}|\mathbf{z}_n)+\ln p(\mathbf{x}_1, \cdots, \mathbf{x}_{n},\mathbf{z}_1, \cdots, \mathbf{z}_{n})\right\}\\
&=\ln p(\mathbf{x}_{n+1}|\mathbf{z}_{n+1})+\max_{\mathbf{z}_n}\left\{\ln p(\mathbf{z}_{n+1}|\mathbf{z}_n)+\max_{\mathbf{z}_1,\cdots,\mathbf{z}_{n-1}}\left\{\ln p(\mathbf{x}_1, \cdots, \mathbf{x}_{n},\mathbf{z}_1, \cdots, \mathbf{z}_{n})\right\}\right\}\\
&=\ln p(\mathbf{x}_{n+1}|\mathbf{z}_{n+1})+\max_{\mathbf{z}_n}\left\{\ln p(\mathbf{z}_{n+1}|\mathbf{z}_n)+\omega(\mathbf{z}_{n})\right\}\\
\end{align*}
$$
$$
\begin{align*}
\omega(\mathbf{z}_{2})&=\max_{\mathbf{z}_1}\left\{\ln p(\mathbf{x}_1, \mathbf{x}_{2},\mathbf{z}_1, \mathbf{z}_{2})\right\}\\
&=\max_{\mathbf{z}_1}\left\{\ln p(\mathbf{z}_1)+\ln p(\mathbf{z}_{2}|\mathbf{z}_1)+\ln p(\mathbf{x}_{1}|\mathbf{z}_{1})+\ln p(\mathbf{x}_{2}|\mathbf{z}_{2})\right\}\\
&=\ln p(\mathbf{x}_{2}|\mathbf{z}_{2})+\max_{\mathbf{z}_1}\left\{\ln p(\mathbf{z}_{2}|\mathbf{z}_1)+\left(\ln p(\mathbf{z}_1)+\ln p(\mathbf{x}_{1}|\mathbf{z}_{1})\right)\right\}\\
&=\ln p(\mathbf{x}_{2}|\mathbf{z}_{2})+\max_{\mathbf{z}_1}\left\{\ln p(\mathbf{z}_{2}|\mathbf{z}_1)+\omega(\mathbf{z}_{1})\right\}\\
\therefore \omega(\mathbf{z}_{1})&=\ln p(\mathbf{z}_1)+\ln p(\mathbf{x}_{1}|\mathbf{z}_{1})
\end{align*}
$$
Exercise (13.17)
$$
\begin{align*}
p(\mathbf{U},\mathbf{X},\mathbf{Z})&=p(\mathbf{u}_1)\left[\prod_{n=2}^Np(\mathbf{z}_{n}|\mathbf{z}_{n-1})\right]p(\mathbf{x}_n|\mathbf{u}_n,\mathbf{z}_n)p(\mathbf{z}_n|\mathbf{u}_n)\\
&=\left[p(\mathbf{u}_1)p(\mathbf{x}_1|\mathbf{u}_1,\mathbf{z}_1)p(\mathbf{z}_1|\mathbf{u}_1)\right]\left[\prod_{n=2}^Np(\mathbf{z}_{n}|\mathbf{z}_{n-1})p(\mathbf{x}_n|\mathbf{u}_n,\mathbf{z}_n)p(\mathbf{z}_n|\mathbf{u}_n)\right]\\
&=:h(\mathbf{z}_1)\prod_{n=2}^Nf_n(\mathbf{z}_{n-1},\mathbf{z}_{n})\\
\therefore h(\mathbf{z}_1)&=p(\mathbf{u}_1)p(\mathbf{x}_1|\mathbf{u}_1,\mathbf{z}_1)p(\mathbf{z}_1|\mathbf{u}_1)\\
f_n(\mathbf{z}_{n-1},\mathbf{z}_{n})&=p(\mathbf{z}_{n}|\mathbf{z}_{n-1})p(\mathbf{x}_n|\mathbf{u}_n,\mathbf{z}_n)p(\mathbf{z}_n|\mathbf{u}_n)
\end{align*}
$$
Exercise (13.18)
図13.15と同じグラフ構造となるため,式(13.49)を利用すると
$$
\begin{align*}
\mu_{f_n\rightarrow\mathbf{z}_n}(\mathbf{z}_n)&=\sum_{\mathbf{z}_{n-1}}f_n(\mathbf{z}_{n-1},\mathbf{z}_{n})\mu_{f_{n-1}\rightarrow\mathbf{z}_{n-1}}(\mathbf{z}_{n-1})\\
&=\sum_{\mathbf{z}_{n-1}}p(\mathbf{z}_{n}|\mathbf{z}_{n-1})p(\mathbf{x}_n|\mathbf{u}_n,\mathbf{z}_n)p(\mathbf{z}_n|\mathbf{u}_n)\mu_{f_{n-1}\rightarrow\mathbf{z}_{n-1}}(\mathbf{z}_{n-1})\\
\therefore\alpha(\mathbf{z}_n)&=\sum_{\mathbf{z}_{n-1}}p(\mathbf{z}_{n}|\mathbf{z}_{n-1})p(\mathbf{x}_n|\mathbf{u}_n,\mathbf{z}_n)p(\mathbf{z}_n|\mathbf{u}_n)\alpha(\mathbf{z}_{n-1})
\end{align*}
$$
同様に式(13.51)を利用すると,
$$
\begin{align*}
\mu_{f_{n+1}\rightarrow f_n}(\mathbf{z}_n)&=\sum_{\mathbf{z}_{n+1}}f_n(\mathbf{z}_{n},\mathbf{z}_{n+1})\mu_{f_{n+2}\rightarrow _{n+1}}(\mathbf{z}_{n+1})\\
&=\sum_{\mathbf{z}_{n+1}}p(\mathbf{z}_{n+1}|\mathbf{z}_{n})p(\mathbf{x}_{n+1}|\mathbf{u}_{n+1},\mathbf{z}_{n+1})p(\mathbf{z}_{n+1}|\mathbf{u}_{n+1})\mu_{f_{n+2}\rightarrow _{n+1}}(\mathbf{z}_{n+1})\\
\therefore\beta(\mathbf{z}_n)&=\sum_{\mathbf{z}_{n+1}}p(\mathbf{z}_{n+1}|\mathbf{z}_{n})p(\mathbf{x}_{n+1}|\mathbf{u}_{n+1},\mathbf{z}_{n+1})p(\mathbf{z}_{n+1}|\mathbf{u}_{n+1})\beta(\mathbf{z}_{n+1})
\end{align*}
$$
Exercise (13.19)
$${\mathbf{z},\mathbf{x}}$$が共にガウス分布から生成される場合,観測変数に対する事後分布$${p(\mathbf{Z}|\mathbf{X})}$$もガウス分布となる。
$$
\begin{align*}
p(\mathbf{Z}|\mathbf{X})&=\mathcal{N}(\mathbf{Z}|\boldsymbol\mu,\boldsymbol\Sigma)\\
\mathbf{Z}&=\begin{pmatrix}\mathbf{z}_1&\cdots&\mathbf{z}_N\end{pmatrix}^{\rm T}\\
\boldsymbol\mu&=\begin{pmatrix}\boldsymbol\mu_1&\cdots&\boldsymbol\mu_N\end{pmatrix}^{\rm T}\
\end{align*}
$$
とおくと,式(2.98)より$${p(\mathbf{z}_n|\mathbf{X})}$$の期待値は$${\boldsymbol\mu_n}$$に一致する。
以上より,$${p(\mathbf{z}_n|\mathbf{X})}$$を個別に最大化した結果は$${p(\mathbf{Z}|\mathbf{X})}$$を最大化した結果に一致する。
Exercise (13.20)
式(13.87)の変数を以下のように式(2.113),(2.114)の変数に対応付けることにより,式(2.115)の結果をそのまま利用できることが分かる。
$$
\begin{align*}
\mathbf{x}&\leftarrow\mathbf{z}_{n-1}\\
\boldsymbol\mu&\leftarrow\boldsymbol\mu_{n-1}\\
\boldsymbol\Lambda&\leftarrow\mathbf{V}_{n-1}\\
\mathbf{y}&\leftarrow\mathbf{z}_{n}\\
\mathbf{A}&\leftarrow\mathbf{A}\\
\mathbf{b}&\leftarrow\mathbf{0}\\
\mathbf{L}^{-1}&\leftarrow\boldsymbol\Gamma
\end{align*}
$$
以上より,題意は示された。
Exercise (13.21) - (13.30)
Exercise (13.21)
式(13.87)を式(13.86)に代入すると,
$$
\begin{align*}
c_n\mathcal{N}(\mathbf{z}_n|\boldsymbol\mu_n,\mathbf{V}_n)&=\mathcal{N}(\mathbf{x}_n|\mathbf{C}\mathbf{z}_n,\boldsymbol\Sigma)\mathcal{N}(\mathbf{z}_n|\mathbf{A}\boldsymbol\mu_{n-1},\mathbf{P}_{n-1})
\end{align*}
$$
となる。
以下のように右辺の変数を式(2.113),(2.114)の変数に対応づけることを考える。
$$
\begin{align*}
\mathbf{x}&\leftarrow\mathbf{z}_{n}\\
\boldsymbol\mu&\leftarrow\mathbf{A}\boldsymbol\mu_{n-1}\\
\boldsymbol\Lambda&\leftarrow\mathbf{P}_{n-1}^{-1}\\
\mathbf{y}&\leftarrow\mathbf{x}_{n}\\
\mathbf{A}&\leftarrow\mathbf{C}\\
\mathbf{b}&\leftarrow\mathbf{0}\\
\mathbf{L}^{-1}&\leftarrow\boldsymbol\Sigma
\end{align*}
$$
すると,右辺は$${p(\mathbf{y}|\mathbf{x})p(\mathbf{x})}$$の状態になっていることに等しいことが分かる。
関係式$${p(\mathbf{y}|\mathbf{x})p(\mathbf{x})=p(\mathbf{x},\mathbf{y})=p(\mathbf{x}|\mathbf{y})p(\mathbf{y})}$$,及び式(2.116)を用いて右辺を変形すると,
$$
\begin{align*}
{\rm (r.h.s)}&=\mathcal{N}(\mathbf{z}_n|\mathbf{G}\{\mathbf{C}^{\rm T}\boldsymbol\Sigma^{-1}\mathbf{x}_n+\mathbf{P}_{n-1}^{-1}\mathbf{A}\boldsymbol\mu_{n-1}\},\mathbf{G})\mathcal{N}(\mathbf{x}_n|\mathbf{C}\mathbf{A}\boldsymbol\mu_{n-1},\mathbf{C}\mathbf{P}_{n-1}\mathbf{C}^{\rm T})\\
\mathbf{G}&=\left(\mathbf{P}_{n-1}^{-1}+\mathbf{C}^{\rm T}\boldsymbol\Sigma^{-1}\mathbf{C}\right)^{-1}
\end{align*}
$$
となる。
左辺と比較することにより,
$$
\begin{align*}
c_n&=\mathcal{N}(\mathbf{x}_n|\mathbf{C}\mathbf{A}\boldsymbol\mu_{n-1},\mathbf{C}\mathbf{P}_{n-1}\mathbf{C}^{\rm T})
\end{align*}
$$
となることが分かる。
式(C.5),式(C.7)を用いて$${\mathbf{G}\mathbf{C}^{\rm T}\boldsymbol\Sigma^{-1}, \mathbf{G}}$$をそれぞれ式変形すると,
$$
\begin{align*}
\mathbf{G}\mathbf{C}^{\rm T}\boldsymbol\Sigma^{-1}&=\left(\mathbf{P}_{n-1}^{-1}+\mathbf{C}^{\rm T}\boldsymbol\Sigma^{-1}\mathbf{C}\right)^{-1}\mathbf{C}^{\rm T}\boldsymbol\Sigma^{-1}\\
&=\mathbf{P}_{n-1}\mathbf{C}^{\rm T}\left(\mathbf{C}\mathbf{P}_{n-1}\mathbf{C}^{\rm T}+\boldsymbol\Sigma\right)^{-1}\\
&=\mathbf{K}_n\\
\mathbf{G}&=\left(\mathbf{P}_{n-1}^{-1}+\mathbf{C}^{\rm T}\boldsymbol\Sigma^{-1}\mathbf{C}\right)^{-1}\\
&=\mathbf{P}_{n-1}-\mathbf{P}_{n-1}\mathbf{C}^{\rm T}\left(\boldsymbol\Sigma+\mathbf{C}\mathbf{P}_{n-1}\mathbf{C}^{\rm T}\right)^{-1}\mathbf{C}\mathbf{P}_{n-1}\\
&=\left(\mathbf{I}-\mathbf{K}_n\mathbf{C}\right)\mathbf{P}_{n-1}
\end{align*}
$$
となる。
以上より,
$$
\begin{align*}
\boldsymbol\mu_n&=\mathbf{A}\boldsymbol\mu_{n-1}+\mathbf{K}_n(\mathbf{x}_n-\mathbf{C}\mathbf{A}\boldsymbol\mu_{n-1})\\
\mathbf{V}_n&=(\mathbf{I}-\mathbf{K}_n\mathbf{C})\mathbf{P}_{n-1}
\end{align*}
$$
が得られる。
Exercise (13.22)
$$
\begin{align*}
c_1\widehat{\alpha}(\mathbf{z}_1)&=p(\mathbf{z}_1)p(\mathbf{x}_1|\mathbf{z}_1)\\
&=p(\mathbf{x}_1)p(\mathbf{z}_1|\mathbf{x}_1)\\
\therefore c_1&=p(\mathbf{x}_1)
\end{align*}
$$
以下のように$${p(\mathbf{z}_1), p(\mathbf{x}_1|\mathbf{z}_1)}$$の変数を式(2.113),(2.114)の変数に対応づけることを考える。
$$
\begin{align*}
\mathbf{x}&\leftarrow\mathbf{z}_{1}\\
\boldsymbol\mu&\leftarrow\boldsymbol\mu_{0}\\
\boldsymbol\Lambda&\leftarrow\mathbf{V}_{0}^{-1}\\
\mathbf{y}&\leftarrow\mathbf{x}_{1}\\
\mathbf{A}&\leftarrow\mathbf{C}\\
\mathbf{b}&\leftarrow\mathbf{0}\\
\mathbf{L}^{-1}&\leftarrow\boldsymbol\Sigma
\end{align*}
$$
このとき,式(2.115)を用いて
$$
\begin{align*}
p(\mathbf{x})&=\mathcal{N}\left(\mathbf{x}_1\left|\mathbf{C}\boldsymbol\mu_0,\boldsymbol\Sigma+\mathbf{C}\mathbf{V}_0\mathbf{C}^{\rm T}\right.\right)\\
\therefore c_1&=\mathcal{N}\left(\mathbf{x}_1\left|\mathbf{C}\boldsymbol\mu_0,\boldsymbol\Sigma+\mathbf{C}\mathbf{V}_0\mathbf{C}^{\rm T}\right.\right)
\end{align*}
$$
Exercise (13.23)
式(2.116)を用いて$${p(\mathbf{z}_1|\mathbf{x}_1)}$$を求めると,
$$
\begin{align*}
p(\mathbf{z}_1|\mathbf{x}_1)&=\mathcal{N}\left(\mathbf{z}_1\left|\mathbf{G}\left\{\mathbf{C}^{\rm T}\boldsymbol\Sigma^{-1}\mathbf{x}_1+\mathbf{V}_0^{-1}\boldsymbol\mu_0\right\},\mathbf{G}\right.\right)\\
\mathbf{G}&=\left(\mathbf{V}_0^{-1}+\mathbf{C}^{\rm T}\boldsymbol\Sigma^{-1}\mathbf{C}\right)^{-1}
\end{align*}
$$
となる。
式(C.5),式(C.7)を用いて$${\mathbf{G}\mathbf{C}^{\rm T}\boldsymbol\Sigma^{-1}, \mathbf{G}}$$をそれぞれ式変形すると,
$$
\begin{align*}
\mathbf{G}\mathbf{C}^{\rm T}\boldsymbol\Sigma^{-1}&=\left(\mathbf{V}_0^{-1}+\mathbf{C}^{\rm T}\boldsymbol\Sigma^{-1}\mathbf{C}\right)^{-1}\mathbf{C}^{\rm T}\boldsymbol\Sigma^{-1}\\
&=\mathbf{V}_0\mathbf{C}^{\rm T}\left(\mathbf{C}\mathbf{V}_0\mathbf{C}^{\rm T}+\boldsymbol\Sigma\right)^{-1}\\
&=\mathbf{K}_1\\
\mathbf{G}&=\left(\mathbf{V}_0^{-1}+\mathbf{C}^{\rm T}\boldsymbol\Sigma^{-1}\mathbf{C}\right)^{-1}\\
&=\mathbf{V}_0-\mathbf{V}_0\mathbf{C}^{\rm T}\left(\boldsymbol\Sigma+\mathbf{C}\mathbf{V}_0\mathbf{C}^{\rm T}\right)^{-1}\mathbf{C}\mathbf{V}_0\\
&=:\left(\mathbf{I}-\mathbf{K}_1\mathbf{C}\right)\mathbf{V}_0
\end{align*}
$$
が得られる。上記の式変形において式(13.97)に従って$${\mathbf{K}_1}$$を定義した。
以上より,
$$
\begin{align*}
\boldsymbol\mu_1&=\boldsymbol\mu_0+\mathbf{K}_1(\mathbf{x}_1-\mathbf{C}\boldsymbol\mu_0)\\
\mathbf{C}&=(\mathbf{I}-\mathbf{K}_1\mathbf{C})\mathbf{V}_0
\end{align*}
$$
が得られる。
Exercise (13.24)
$$
\begin{align*}
\mathbf{C}\mathbf{z}+\mathbf{c}&=\begin{pmatrix}\mathbf{C}&\mathbf{c}\end{pmatrix}\begin{pmatrix}\mathbf{z}\\ 1\end{pmatrix}
\end{align*}
$$
より,$${\mathbf{z}}$$に定数1の行を加え,$${\mathbf{C}}$$にそれぞれ$${\mathbf{c}}$$列を追加することにより,定数項がない場合と同様の数式を取り扱う問題に帰着する。
$${\mathbf{A}, \mathbf{a}}$$の場合は,$${\mathbf{z}_n, \mathbf{A}\mathbf{z}_{n-1}}$$の成分数が同じ$${K+1}$$になること,及び$${\mathbf{z}_n}$$の$${K+1}$$番目の要素が1とならなければならないことを考慮すると,
$$
\begin{align*}
\mathbf{A}'&=\begin{pmatrix}\mathbf{A}&\mathbf{a}\\\mathbf{0}^{\rm T}&1\end{pmatrix}
\end{align*}
$$
とする。
$${\boldsymbol\mu_0, \mathbf{V}_0,\boldsymbol\Gamma}$$についても同様に拡張する。
$$
\begin{align*}
\boldsymbol\mu_0'&=\begin{pmatrix}\boldsymbol\mu_0\\1\end{pmatrix}\\
\mathbf{V}_0'&=\begin{pmatrix}\mathbf{V}_0&\mathbf{0}\\\mathbf{0}^{\rm T}&0\end{pmatrix}\\
\boldsymbol\Gamma'&=\begin{pmatrix}\boldsymbol\Gamma&\mathbf{0}\\\mathbf{0}^{\rm T}&0\end{pmatrix}
\end{align*}
$$
Exercise (13.25)
$$
\begin{align*}
\mu_n&=\mu_{n-1}+K_n(x_n-\mu_{n-1})\\
V_n&=(1-K_n)V_{n-1}\\
K_n&=V_{n-1}(V_{n-1}+\sigma^2)^{-1}
\end{align*}
$$
となるため,
$$
\begin{align*}
\frac{1}{V_N}&=\frac{1}{(1-K_N)V_{N-1}}\\
&=\frac{1}{\sigma^2(V_{N-1}+\sigma^2)^{-1}V_{N-1}}\\
&=\frac{1}{V_{N-1}}+\frac{1}{\sigma^2}\\
&=\frac{1}{V_{N-2}}+\frac{2}{\sigma^2}\\
&\ \ \ \vdots\\
&=\frac{1}{V_{0}}+\frac{N}{\sigma^2}\\
&=\frac{1}{\sigma_0^2}+\frac{N}{\sigma^2}\\
\end{align*}
$$
$$
\begin{align*}
\mu_N&=\mu_{N-1}+K_{N-1}(x_N-\mu_{N-1})\\
&=\frac{\sigma^2}{\sigma^2+V_{N-1}}\mu_{N-1}+\frac{V_{N-1}}{\sigma^2+V_{N-1}}x_N\\
&=\frac{\sigma^2+(N-1)\sigma_0^2}{\sigma^2+N\sigma_0^2}\mu_{N-1}+\frac{\sigma_0^2}{\sigma^2+N\sigma_0^2}x_{N}\\
&=\frac{\sigma^2+(N-1)\sigma_0^2}{\sigma^2+N\sigma_0^2}\left(\frac{\sigma^2+(N-2)\sigma_0^2}{\sigma^2+(N-1)\sigma_0^2}\mu_{N-2}+\frac{\sigma_0^2}{\sigma^2+(N-1)\sigma_0^2}x_{N-1}\right)+\frac{\sigma_0^2}{\sigma^2+N\sigma_0^2}x_{N}\\
&=\frac{\sigma^2+(N-2)\sigma_0^2}{\sigma^2+N\sigma_0^2}\mu_{N-2}+\frac{\sigma_0^2}{\sigma^2+N\sigma_0^2}(x_{N-1}+x_{N})\\
&\ \ \ \vdots\\
&=\frac{\sigma^2}{\sigma^2+N\sigma_0^2}\mu_{0}+\frac{\sigma_0^2}{\sigma^2+N\sigma_0^2}\sum_{n=1}^Nx_{n}\\
&=\frac{\sigma^2}{\sigma^2+N\sigma_0^2}\mu_{0}+\frac{N\sigma_0^2}{\sigma^2+N\sigma_0^2}\mu_{\rm ML}\\
\end{align*}
$$
が得られる。
Exercise (13.26)
$${\boldsymbol\Gamma=\mathbf{I},\boldsymbol\Sigma=\sigma^2\mathbf{I},\mathbf{A}=\mathbf{0}}$$の場合,
$$
\begin{align*}
c_n\mathcal{N}(\mathbf{z}_n|\boldsymbol\mu_n,\mathbf{V}_n)&=\mathcal{N}(\mathbf{x}_n|\mathbf{C}\mathbf{z}_n,\sigma^2\mathbf{I})\mathcal{N}(\mathbf{z}_n|\mathbf{0},\mathbf{I})
\end{align*}
$$
となる。
以下のように右辺の変数を式(2.113),(2.114)の変数に対応づけることを考える。
$$
\begin{align*}
\mathbf{x}&\leftarrow\mathbf{z}_{n}\\
\boldsymbol\mu&\leftarrow\mathbf{0}\\
\boldsymbol\Lambda&\leftarrow\mathbf{I}\\
\mathbf{y}&\leftarrow\mathbf{x}_{n}\\
\mathbf{A}&\leftarrow\mathbf{C}\\
\mathbf{b}&\leftarrow\mathbf{0}\\
\mathbf{L}^{-1}&\leftarrow\boldsymbol\Sigma
\end{align*}
$$
すると,右辺は$${p(\mathbf{y}|\mathbf{x})p(\mathbf{x})}$$の状態になっていることに等しいことが分かる。
関係式$${p(\mathbf{y}|\mathbf{x})p(\mathbf{x})=p(\mathbf{x},\mathbf{y})=p(\mathbf{x}|\mathbf{y})p(\mathbf{y})}$$,及び式(2.116)を用いて右辺を変形すると,
$$
\begin{align*}
{\rm (r.h.s)}&=\mathcal{N}(\mathbf{z}_n|\mathbf{G}\sigma^{-2}\mathbf{C}^{\rm T}\mathbf{x}_n,\mathbf{G})\mathcal{N}(\mathbf{x}_n|\mathbf{0},\mathbf{C}\mathbf{C}^{\rm T})\\
\mathbf{G}&=\left(\mathbf{I}+\sigma^{-2}\mathbf{C}^{\rm T}\mathbf{C}\right)^{-1}
\end{align*}
$$
となる。
$${\mathbf{C}}$$を$${\mathbf{W}}$$に書き換えると,
$$
\begin{align*}
\mathbf{G}&=\left(\mathbf{I}+\sigma^{-2}\mathbf{W}^{\rm T}\mathbf{W}\right)^{-1}\\
&=\sigma^{2}\left(\sigma^{2}\mathbf{I}+\mathbf{W}^{\rm T}\mathbf{W}\right)^{-1}\\
&=\sigma^{2}\mathbf{M}^{-1}\\
\therefore {\rm (r.h.s)}&\propto \mathcal{N}(\mathbf{z}_n|\mathbf{M}^{-1}\mathbf{W}^{\rm T}\mathbf{x}_n,\sigma^{2}\mathbf{M}^{-1})
\end{align*}
$$
Exercise (13.27)
$${\boldsymbol\Sigma=\mathbf{0}}$$のとき,
$$
\begin{align*}
\mathbf{K}_n&=\mathbf{P}_{n-1}\mathbf{C}^{\rm T}(\mathbf{C}\mathbf{P}_{n-1}\mathbf{C}^{\rm T}+\boldsymbol\Sigma)^{-1}\\
&=\mathbf{P}_{n-1}\mathbf{C}^{\rm T}(\mathbf{C}\mathbf{P}_{n-1}\mathbf{C}^{\rm T})^{-1}\\
&=\mathbf{P}_{n-1}\mathbf{C}^{\rm T}(\mathbf{P}_{n-1}\mathbf{C}^{\rm T})^{-1}\mathbf{C}^{-1}\\
&=\mathbf{C}^{-1}
\end{align*}
$$
となるため,
$$
\begin{align*}
\boldsymbol\mu_n&=\mathbf{A}\boldsymbol\mu_{n-1}+\mathbf{K}_n(\mathbf{x}_n-\mathbf{C}\mathbf{A}\boldsymbol\mu_{n-1})\\
&=\mathbf{A}\boldsymbol\mu_{n-1}+\mathbf{C}^{-1}\mathbf{x}_n-\mathbf{C}^{-1}\mathbf{A}\boldsymbol\mu_{n-1}\\
&=\mathbf{C}^{-1}\mathbf{x}_n\\
\mathbf{V}_n&=(\mathbf{I}-\mathbf{K}_n\mathbf{C})\mathbf{P}_{n-1}\\
&=(\mathbf{I}-\mathbf{I})\mathbf{P}_{n-1}\\
&=\mathbf{0}
\end{align*}
$$
Exercise (13.28)
$${\mathbf{V}_0\rightarrow\infty}$$のとき,
$$
\begin{align*}
\mathbf{V}_1&=\left(\mathbf{V}_0^{-1}+\mathbf{C}^{\rm T}\boldsymbol\Sigma^{-1}\mathbf{C}\right)^{-1}\\
&\simeq\left(\mathbf{C}^{\rm T}\boldsymbol\Sigma^{-1}\mathbf{C}\right)^{-1}\\
\boldsymbol\mu_1&=\mathbf{V}_1\left\{\mathbf{C}^{\rm T}\boldsymbol\Sigma^{-1}\mathbf{x}_1+\mathbf{V}_0^{-1}\boldsymbol\mu_0\right\}\\
&\simeq\left(\mathbf{C}^{\rm T}\boldsymbol\Sigma^{-1}\mathbf{C}\right)^{-1}\mathbf{C}^{\rm T}\boldsymbol\Sigma^{-1}\mathbf{x}_1\\
&=\mathbf{C}^{-1}\mathbf{x}_1
\end{align*}
$$
となる。
$${\mathbf{A}=\mathbf{I}, \boldsymbol\Gamma=\mathbf{0}}$$の場合,$${n=2}$$について計算すると,
$$
\begin{align*}
\mathbf{P}_1&=\mathbf{V}_1\\
&=\left(\mathbf{C}^{\rm T}\boldsymbol\Sigma^{-1}\mathbf{C}\right)^{-1}\\
\mathbf{K}_2&=\mathbf{P}_1\mathbf{C}^{\rm T}\left(\mathbf{C}\mathbf{P}_{1}\mathbf{C}^{\rm T}+\boldsymbol\Sigma\right)^{-1}\\
&=\left(\boldsymbol\Sigma^{-1}\mathbf{C}\right)^{-1}\left(\boldsymbol\Sigma+\boldsymbol\Sigma\right)^{-1}\\
&=\frac{1}{2}\mathbf{C}^{-1}\\
\therefore \boldsymbol\mu_2&=\boldsymbol\mu_1+\mathbf{K}_2(\mathbf{x}_2-\mathbf{C}\boldsymbol\mu_1)\\
&=\mathbf{C}^{-1}\frac{1}{2}(\mathbf{x}_1+\mathbf{x}_2)\\
\mathbf{V}_2&=(\mathbf{I}-\mathbf{K}_2\mathbf{C})\mathbf{P}_1\\
&=\frac{1}{2}\left(\mathbf{C}^{\rm T}\boldsymbol\Sigma^{-1}\mathbf{C}\right)^{-1}
\end{align*}
$$
が得られる。
次に$${n=k}$$で
$$
\begin{align*}
\boldsymbol\mu_k&=\mathbf{C}^{-1}\frac{1}{k}\sum_{i=1}^k\mathbf{x}_i\\
\mathbf{V}_k&=\frac{1}{k}\left(\mathbf{C}^{\rm T}\boldsymbol\Sigma^{-1}\mathbf{C}\right)^{-1}
\end{align*}
$$
が成立すると仮定する。
このとき,$${n=k+1}$$について考えると,
$$
\begin{align*}
\mathbf{P}_k&=\mathbf{V}_k\\
&=\frac{1}{k}\left(\mathbf{C}^{\rm T}\boldsymbol\Sigma^{-1}\mathbf{C}\right)^{-1}\\
\mathbf{K}_{k+1}&=\mathbf{P}_k\mathbf{C}^{\rm T}\left(\mathbf{C}\mathbf{P}_{k}\mathbf{C}^{\rm T}+\boldsymbol\Sigma\right)^{-1}\\
&=\frac{1}{k}\left(\boldsymbol\Sigma^{-1}\mathbf{C}\right)^{-1}\left(\frac{1}{k}\boldsymbol\Sigma+\boldsymbol\Sigma\right)^{-1}\\
&=\frac{1}{k+1}\mathbf{C}^{-1}\\ \boldsymbol\mu_{k+1}&=\boldsymbol\mu_{k}+\mathbf{K}_{k+1}(\mathbf{x}_{k+1}-\mathbf{C}\boldsymbol\mu_k)\\
&=\frac{1}{k+1}(k\boldsymbol\mu_{k}+\mathbf{C}^{-1}\mathbf{x}_{k+1})\\
&=\mathbf{C}^{-1}\frac{1}{k+1}\sum_{i=1}^{k+1}\mathbf{x}_{i}\\
\mathbf{V}_{k+1}&=(\mathbf{I}-\mathbf{K}_{k+1}\mathbf{C})\mathbf{P}_k\\
&=\frac{1}{k+1}\left(\mathbf{C}^{\rm T}\boldsymbol\Sigma^{-1}\mathbf{C}\right)^{-1}
\end{align*}
$$
となる。
以上より,$${n\geq 1}$$において,
$$
\begin{align*}
\boldsymbol\mu_{n}&=\mathbf{C}^{-1}\frac{1}{n}\sum_{i=1}^{n}\mathbf{x}_{i}\\
\mathbf{V}_{n}&=\frac{1}{n}\left(\mathbf{C}^{\rm T}\boldsymbol\Sigma^{-1}\mathbf{C}\right)^{-1}
\end{align*}
$$
が成立する。
$${\mathbf{C}=\mathbf{I}}$$の場合,
$$
\begin{align*}
\boldsymbol\mu_{n}&=\frac{1}{n}\sum_{i=1}^{n}\mathbf{x}_{i}\\
\mathbf{V}_{n}&=\frac{1}{n}\boldsymbol\Sigma
\end{align*}
$$
となる。
Exercise (13.29)
式(13.99)の両辺に$${\widehat{\alpha}(\mathbf{z}_n)}$$をかけると,
$$
\begin{align*}
c_{n+1}\widehat{\alpha}(\mathbf{z}_n)\widehat{\beta}(\mathbf{z}_n)&=\widehat{\alpha}(\mathbf{z}_n)\int{\rm d}\mathbf{z}_{n+1}\widehat{\beta}(\mathbf{z}_{n+1})p(\mathbf{x}_{n+1}|\mathbf{z}_{n+1})p(\mathbf{z}_{n+1}|\mathbf{z}_{n})\\
c_{n+1}\mathcal{N}\left(\mathbf{z}_n\left|\widehat{\boldsymbol\mu}_n,\widehat{\mathbf{V}}_n\right.\right)&=\mathcal{N}\left(\mathbf{z}_n\left|\boldsymbol\mu_n,\mathbf{V}_n\right.\right)\int{\rm d}\mathbf{z}_{n+1}\widehat{\beta}(\mathbf{z}_{n+1})\mathcal{N}\left(\mathbf{x}_{n+1}\left|\mathbf{C}\mathbf{z}_{n+1}, \boldsymbol\Sigma\right.\right)\mathcal{N}\left(\mathbf{z}_{n+1}\left|\mathbf{A}\mathbf{z}_n, \boldsymbol\Gamma\right.\right)\\
c_{n+1}\mathcal{N}\left(\mathbf{z}_n\left|\widehat{\boldsymbol\mu}_n,\widehat{\mathbf{V}}_n\right.\right)&=\int{\rm d}\mathbf{z}_{n+1}\widehat{\beta}(\mathbf{z}_{n+1})\mathcal{N}\left(\mathbf{x}_{n+1}\left|\mathbf{C}\mathbf{z}_{n+1}, \boldsymbol\Sigma\right.\right)\left\{\mathcal{N}\left(\mathbf{z}_n\left|\boldsymbol\mu_n,\mathbf{V}_n\right.\right)\mathcal{N}\left(\mathbf{z}_{n+1}\left|\mathbf{A}\mathbf{z}_n, \boldsymbol\Gamma\right.\right)\right\}\\
\end{align*}
$$
式(2.115),(2.116)を利用して$${\mathcal{N}\left(\mathbf{z}_n\left|\boldsymbol\mu_n,\mathbf{V}_n\right.\right)\mathcal{N}\left(\mathbf{z}_{n+1}\left|\mathbf{A}\mathbf{z}_n, \boldsymbol\Gamma\right.\right)}$$を式変形すると,
$$
\begin{align*}
\mathcal{N}\left(\mathbf{z}_n\left|\boldsymbol\mu_n,\mathbf{V}_n\right.\right)\mathcal{N}\left(\mathbf{z}_{n+1}\left|\mathbf{A}\mathbf{z}_n, \boldsymbol\Gamma\right.\right)&=\mathcal{N}\left(\mathbf{z}_n\left|\mathbf{J}_n\mathbf{z}_{n+1}+(\mathbf{I}-\mathbf{J}_n\mathbf{A})\boldsymbol\mu_n,(\mathbf{I}-\mathbf{J}_n\mathbf{A})\mathbf{V}_n\right.\right)\mathcal{N}\left(\mathbf{z}_{n+1}\left|\mathbf{A}\boldsymbol\mu_n, \mathbf{P}_n\right.\right)
\end{align*}
$$
$${\mathcal{N}\left(\mathbf{z}_{n+1}\left|\mathbf{A}\boldsymbol\mu_n, \mathbf{P}_n\right.\right)\mathcal{N}\left(\mathbf{x}_{n+1}\left|\mathbf{C}\mathbf{z}_{n+1}, \boldsymbol\Sigma\right.\right)}$$に対して再度,式(2.115),(2.116)を利用して式変形すると,
$$
\begin{align*}
\mathcal{N}\left(\mathbf{z}_{n+1}\left|\mathbf{A}\boldsymbol\mu_n, \mathbf{P}_n\right.\right)\mathcal{N}\left(\mathbf{x}_{n+1}\left|\mathbf{C}\mathbf{z}_{n+1}, \boldsymbol\Sigma\right.\right)&=\mathcal{N}\left(\mathbf{z}_{n+1}\left|\boldsymbol\mu_{n+1}, \mathbf{V}_{n+1}\right.\right)\mathcal{N}\left(\mathbf{x}_{n+1}\left|\mathbf{C}\mathbf{A}\boldsymbol\mu_{n}, \boldsymbol\Sigma+\mathbf{C}\mathbf{P}_n\mathbf{C}^{\rm T}\right.\right)\\
&=\widehat{\alpha}(\mathbf{z}_{n+1})\mathcal{N}\left(\mathbf{x}_{n+1}\left|\mathbf{C}\mathbf{A}\boldsymbol\mu_{n}, \boldsymbol\Sigma+\mathbf{C}\mathbf{P}_n\mathbf{C}^{\rm T}\right.\right)
\end{align*}
$$
以上より,式(13.99)は以下のように式変形できる。
$$
\begin{align*}
c_{n+1}\mathcal{N}\left(\mathbf{z}_n\left|\widehat{\boldsymbol\mu}_n,\widehat{\mathbf{V}}_n\right.\right)&=\mathcal{N}\left(\mathbf{x}_{n+1}\left|\mathbf{C}\mathbf{A}\boldsymbol\mu_{n}, \boldsymbol\Sigma+\mathbf{C}\mathbf{P}_n\mathbf{C}^{\rm T}\right.\right)\int{\rm d}\mathbf{z}_{n+1}\widehat{\alpha}(\mathbf{z}_{n+1})\widehat{\beta}(\mathbf{z}_{n+1})\mathcal{N}\left(\mathbf{z}_n\left|\mathbf{J}_n\mathbf{z}_{n+1}+(\mathbf{I}-\mathbf{J}_n\mathbf{A})\boldsymbol\mu_n,(\mathbf{I}-\mathbf{J}_n\mathbf{A})\mathbf{V}_n\right.\right)\\
&=\mathcal{N}\left(\mathbf{x}_{n+1}\left|\mathbf{C}\mathbf{A}\boldsymbol\mu_{n}, \boldsymbol\Sigma+\mathbf{C}\mathbf{P}_n\mathbf{C}^{\rm T}\right.\right)\int{\rm d}\mathbf{z}_{n+1}\mathcal{N}\left(\mathbf{z}_{n+1}\left|\widehat{\boldsymbol\mu}_{n+1},\widehat{\mathbf{V}}_{n+1}\right.\right)\mathcal{N}\left(\mathbf{z}_n\left|\mathbf{J}_n\mathbf{z}_{n+1}+(\mathbf{I}-\mathbf{J}_n\mathbf{A})\boldsymbol\mu_n,(\mathbf{I}-\mathbf{J}_n\mathbf{A})\mathbf{V}_n\right.\right)\\
\therefore\mathcal{N}\left(\mathbf{z}_n\left|\widehat{\boldsymbol\mu}_n,\widehat{\mathbf{V}}_n\right.\right)&=\int{\rm d}\mathbf{z}_{n+1}\mathcal{N}\left(\mathbf{z}_{n+1}\left|\widehat{\boldsymbol\mu}_{n+1},\widehat{\mathbf{V}}_{n+1}\right.\right)\mathcal{N}\left(\mathbf{z}_n\left|\mathbf{J}_n\mathbf{z}_{n+1}+(\mathbf{I}-\mathbf{J}_n\mathbf{A})\boldsymbol\mu_n,(\mathbf{I}-\mathbf{J}_n\mathbf{A})\mathbf{V}_n\right.\right)
\end{align*}
$$
上式の積分は式(2.115)を再び利用することが計算することができる。
$$
\begin{align*}
\int{\rm d}\mathbf{z}_{n+1}\mathcal{N}\left(\mathbf{z}_{n+1}\left|\widehat{\boldsymbol\mu}_{n+1},\widehat{\mathbf{V}}_{n+1}\right.\right)\mathcal{N}\left(\mathbf{z}_n\left|\mathbf{J}_n\mathbf{z}_{n+1}+(\mathbf{I}-\mathbf{J}_n\mathbf{A})\boldsymbol\mu_n,(\mathbf{I}-\mathbf{J}_n\mathbf{A})\mathbf{V}_n\right.\right)&=\mathcal{N}\left(\mathbf{z}_n\left|\mathbf{J}_n\widehat{\boldsymbol\mu}_{n+1}+(\mathbf{I}-\mathbf{J}_n\mathbf{A})\boldsymbol\mu_n,(\mathbf{I}-\mathbf{J}_n\mathbf{A})\mathbf{V}_n+\mathbf{J}_n\widehat{\mathbf{V}}_{n+1}\mathbf{J}_n^{\rm T}\right.\right)\\
&=\mathcal{N}\left(\mathbf{z}_n\left|\boldsymbol\mu_n+\mathbf{J}_n(\widehat{\boldsymbol\mu}_{n+1}-\mathbf{A}\boldsymbol\mu_n),\mathbf{V}_n-\mathbf{J}_n\mathbf{A}\mathbf{V}_n+\mathbf{J}_n\widehat{\mathbf{V}}_{n+1}\mathbf{J}_n^{\rm T}\right.\right)\\
&=\mathcal{N}\left(\mathbf{z}_n\left|\boldsymbol\mu_n+\mathbf{J}_n(\widehat{\boldsymbol\mu}_{n+1}-\mathbf{A}\boldsymbol\mu_n),\mathbf{V}_n-\mathbf{J}_n\mathbf{P}_n\mathbf{J}_n^{\rm T}+\mathbf{J}_n\widehat{\mathbf{V}}_{n+1}\mathbf{J}_n^{\rm T}\right.\right)\\
&=\mathcal{N}\left(\mathbf{z}_n\left|\boldsymbol\mu_n+\mathbf{J}_n(\widehat{\boldsymbol\mu}_{n+1}-\mathbf{A}\boldsymbol\mu_n),\mathbf{V}_n+\mathbf{J}_n(\widehat{\mathbf{V}}_{n+1}-\mathbf{P}_n)\mathbf{J}_n^{\rm T}\right.\right)\\
\end{align*}
$$
$$
\begin{align*}
\therefore \widehat{\boldsymbol\mu}_{n}&=\boldsymbol\mu_n+\mathbf{J}_n(\widehat{\boldsymbol\mu}_{n+1}-\mathbf{A}\boldsymbol\mu_n)\\
\therefore \widehat{\mathbf{V}}_{n}&=\mathbf{V}_n+\mathbf{J}_n(\widehat{\mathbf{V}}_{n+1}-\mathbf{P}_n)\mathbf{J}_n^{\rm T}
\end{align*}
$$
Exercise (13.30)
$$
\begin{align*}
\xi(\mathbf{z}_{n-1},\mathbf{z}_{n})&=\frac{\widehat{\alpha}(\mathbf{z}_{n-1})p(\mathbf{x}_{n}|\mathbf{z}_{n})p(\mathbf{z}_{n}|\mathbf{z}_{n-1})\widehat{\beta}(\mathbf{z}_{n})}{c_n}\\
&=\frac{\widehat{\alpha}(\mathbf{z}_{n-1})p(\mathbf{x}_{n}|\mathbf{z}_{n})p(\mathbf{z}_{n}|\mathbf{z}_{n-1})\widehat{\alpha}(\mathbf{z}_{n})\widehat{\beta}(\mathbf{z}_{n})}{c_n\widehat{\alpha}(\mathbf{z}_{n})}\\
&=\frac{\mathcal{N}\left(\mathbf{z}_{n-1}\left|\boldsymbol\mu_{n-1},\mathbf{V}_{n-1}\right.\right)\mathcal{N}\left(\mathbf{x}_{n}\left|\mathbf{C}\mathbf{z}_{n},\boldsymbol\Sigma\right.\right)\mathcal{N}\left(\mathbf{z}_{n}\left|\mathbf{A}\mathbf{z}_{n-1},\boldsymbol\Gamma\right.\right)\mathcal{N}\left(\mathbf{z}_n\left|\widehat{\boldsymbol\mu}_n,\widehat{\mathbf{V}}_n\right.\right)}{c_n\widehat{\alpha}(\mathbf{z}_{n})}\\
\end{align*}
$$
Exercise (13.31) - (13.34)
Exercise (13.31)
Exercise (13.29), (13.30)の結果を利用することにより,
$$
\begin{align*}
\xi(\mathbf{z}_{n-1},\mathbf{z}_{n})&=\frac{\mathcal{N}\left(\mathbf{z}_{n-1}\left|\boldsymbol\mu_{n-1},\mathbf{V}_{n-1}\right.\right)\mathcal{N}\left(\mathbf{x}_{n}\left|\mathbf{C}\mathbf{z}_{n},\boldsymbol\Sigma\right.\right)\mathcal{N}\left(\mathbf{z}_{n}\left|\mathbf{A}\mathbf{z}_{n-1},\boldsymbol\Gamma\right.\right)\mathcal{N}\left(\mathbf{z}_n\left|\widehat{\boldsymbol\mu}_n,\widehat{\mathbf{V}}_n\right.\right)}{c_n\widehat{\alpha}(\mathbf{z}_{n})}\\
&=\mathcal{N}\left(\mathbf{z}_{n}\left|\widehat{\boldsymbol\mu}_{n},\widehat{\mathbf{V}}_{n}\right.\right)\mathcal{N}\left(\mathbf{z}_{n-1}\left|\mathbf{J}_{n-1}\mathbf{z}_{n}+(\mathbf{I}-\mathbf{J}_{n-1}\mathbf{A})\boldsymbol\mu_{n-1},(\mathbf{I}-\mathbf{J}_{n-1}\mathbf{A})\mathbf{V}_{n-1}\right.\right)
\end{align*}
$$
と式変形できるので,
$$
\begin{align*}
\mathbb{E}\left[\mathbf{z}_{n}\mathbf{z}_{n-1}^{\rm T}\right]&=\int{\rm d}\mathbf{z}_{n}\int{\rm d}\mathbf{z}_{n-1}\mathbf{z}_{n}\mathbf{z}_{n-1}^{\rm T}\xi(\mathbf{z}_{n-1},\mathbf{z}_{n})\\
&=\int{\rm d}\mathbf{z}_{n}\mathbf{z}_{n}\mathcal{N}\left(\mathbf{z}_{n}\left|\widehat{\boldsymbol\mu}_{n},\widehat{\mathbf{V}}_{n}\right.\right)\int{\rm d}\mathbf{z}_{n-1}\mathbf{z}_{n-1}^{\rm T}\mathcal{N}\left(\mathbf{z}_{n-1}\left|\mathbf{J}_{n-1}\mathbf{z}_{n}+(\mathbf{I}-\mathbf{J}_{n-1}\mathbf{A})\boldsymbol\mu_{n-1},(\mathbf{I}-\mathbf{J}_{n-1}\mathbf{A})\mathbf{V}_{n-1}\right.\right)\\
&=\int{\rm d}\mathbf{z}_{n}\mathbf{z}_{n}\left\{\mathbf{J}_{n-1}\mathbf{z}_{n}+(\mathbf{I}-\mathbf{J}_{n-1}\mathbf{A})\boldsymbol\mu_{n-1}\right\}^{\rm T}\mathcal{N}\left(\mathbf{z}_{n}\left|\widehat{\boldsymbol\mu}_{n},\widehat{\mathbf{V}}_{n}\right.\right)\\
&=\int{\rm d}\mathbf{z}_{n}\left\{\mathbf{z}_{n}\mathbf{z}_{n}^{\rm T}\mathbf{J}_{n-1}^{\rm T}+\mathbf{z}_{n}\boldsymbol\mu_{n-1}^{\rm T}-\mathbf{z}_{n}\boldsymbol\mu_{n-1}^{\rm T}\mathbf{A}^{\rm T}\mathbf{J}_{n-1}^{\rm T}\right\}\mathcal{N}\left(\mathbf{z}_{n}\left|\widehat{\boldsymbol\mu}_{n},\widehat{\mathbf{V}}_{n}\right.\right)\\
&=\left(\widehat{\boldsymbol\mu}_{n}\widehat{\boldsymbol\mu}_{n}^{\rm T}+\widehat{\mathbf{V}}_{n}\right)\mathbf{J}_{n-1}^{\rm T}+\widehat{\boldsymbol\mu}_{n}\boldsymbol\mu_{n-1}^{\rm T}-\widehat{\boldsymbol\mu}_{n}\boldsymbol\mu_{n-1}^{\rm T}\mathbf{A}^{\rm T}\mathbf{J}_{n-1}^{\rm T}\\
&=\left(\widehat{\boldsymbol\mu}_{n}\widehat{\boldsymbol\mu}_{n}^{\rm T}+\widehat{\mathbf{V}}_{n}\right)\mathbf{J}_{n-1}^{\rm T}+\widehat{\boldsymbol\mu}_{n}\left(\widehat{\boldsymbol\mu}_{n-1}-\mathbf{J}_{n-1}\widehat{\boldsymbol\mu}_{n}\right)^{\rm T}\\
&=\widehat{\mathbf{V}}_{n}\mathbf{J}_{n-1}^{\rm T}+\widehat{\boldsymbol\mu}_{n}\widehat{\boldsymbol\mu}_{n-1}^{\rm T}\\
\therefore {\rm cov}[\mathbf{z}_{n},\mathbf{z}_{n-1}]&=\mathbb{E}\left[\mathbf{z}_{n}\mathbf{z}_{n-1}^{\rm T}\right]-\mathbb{E}\left[\mathbf{z}_{n}\right]\mathbb{E}\left[\mathbf{z}_{n-1}\right]^{\rm T}\\
&=\widehat{\mathbf{V}}_{n}\mathbf{J}_{n-1}^{\rm T}+\widehat{\boldsymbol\mu}_{n}\widehat{\boldsymbol\mu}_{n-1}^{\rm T}-\widehat{\boldsymbol\mu}_{n}\widehat{\boldsymbol\mu}_{n-1}^{\rm T}\\
&=\widehat{\mathbf{V}}_{n}\mathbf{J}_{n-1}^{\rm T}
\end{align*}
$$
Exercise (13.32)
$$
\begin{align*}
\mathcal{Q}\left(\boldsymbol\theta, \boldsymbol\theta^{\rm old}\right)&=-\frac{1}{2}\ln|\mathbf{V}_0|-\frac{1}{2}\mathbb{E}\left[\mathbf{z}_1^{\rm T}\mathbf{V}_0^{-1}\mathbf{z}_1\right]+\boldsymbol\mu_0^{\rm T}\mathbf{V}_0^{-1}\mathbb{E}\left[\mathbf{z}_1\right]-\frac{1}{2}\boldsymbol\mu_0^{\rm T}\mathbf{V}_0^{-1}\boldsymbol\mu_0+{\rm const}\\
&=\frac{1}{2}\ln|\mathbf{V}_0^{-1}|-\frac{1}{2}\mathbb{E}\left[{\rm Tr}\left(\mathbf{z}_1^{\rm T}\mathbf{V}_0^{-1}\mathbf{z}_1\right)\right]+\boldsymbol\mu_0^{\rm T}\mathbf{V}_0^{-1}\mathbb{E}\left[\mathbf{z}_1\right]-\frac{1}{2}\boldsymbol\mu_0^{\rm T}\mathbf{V}_0^{-1}\boldsymbol\mu_0+{\rm const}\\
&=\frac{1}{2}\ln|\mathbf{V}_0^{-1}|-\frac{1}{2}\mathbb{E}\left[{\rm Tr}\left(\mathbf{z}_1\mathbf{z}_1^{\rm T}\mathbf{V}_0^{-1}\right)\right]+\boldsymbol\mu_0^{\rm T}\mathbf{V}_0^{-1}\mathbb{E}\left[\mathbf{z}_1\right]-\frac{1}{2}\boldsymbol\mu_0^{\rm T}\mathbf{V}_0^{-1}\boldsymbol\mu_0+{\rm const}\\
&=\frac{1}{2}\ln|\mathbf{V}_0^{-1}|-\frac{1}{2}{\rm Tr}\left(\mathbb{E}\left[\mathbf{z}_1\mathbf{z}_1^{\rm T}\right]\mathbf{V}_0^{-1}\right)+\boldsymbol\mu_0^{\rm T}\mathbf{V}_0^{-1}\mathbb{E}\left[\mathbf{z}_1\right]-\frac{1}{2}\boldsymbol\mu_0^{\rm T}\mathbf{V}_0^{-1}\boldsymbol\mu_0+{\rm const}\\
\end{align*}
$$
$${\mathcal{Q}\left(\boldsymbol\theta, \boldsymbol\theta^{\rm old}\right)}$$を$${\boldsymbol\mu_0}$$で微分すると,
$$
\begin{align*}
\frac{\partial\mathcal{Q}\left(\boldsymbol\theta, \boldsymbol\theta^{\rm old}\right)}{\partial\boldsymbol\mu_0}&=\mathbf{V}_0^{-1}\mathbb{E}\left[\mathbf{z}_1\right]-\mathbf{V}_0^{-1}\boldsymbol\mu_0\\
&=\mathbf{V}_0^{-1}\left(\mathbb{E}\left[\mathbf{z}_1\right]-\boldsymbol\mu_0\right)\\
&=\mathbf{0}\\
\therefore \boldsymbol\mu_0^{\rm new}&=\mathbb{E}\left[\mathbf{z}_1\right]
\end{align*}
$$
$${\boldsymbol\mu_0=\mathbb{E}\left[\mathbf{z}_1\right]}$$として$${\mathcal{Q}\left(\boldsymbol\theta, \boldsymbol\theta^{\rm old}\right)}$$を$${\mathbf{V}_0^{-1}}$$で微分すると,
$$
\begin{align*}
\frac{\partial\mathcal{Q}\left(\boldsymbol\theta, \boldsymbol\theta^{\rm old}\right)}{\partial\mathbf{V}_0^{-1}}&=\frac{1}{2}\frac{\partial}{\partial\mathbf{V}_0^{-1}}\ln|\mathbf{V}_0^{-1}|-\frac{1}{2}\frac{\partial}{\partial\mathbf{V}_0^{-1}}{\rm Tr}\left[\mathbb{E}\left[\mathbf{z}_1\mathbf{z}_1^{\rm T}\right]\mathbf{V}_0^{-1}\right]+\mathbb{E}\left[\mathbf{z}_1^{\rm T}\right]\frac{\partial\mathbf{V}_0^{-1}}{\partial\mathbf{V}_0^{-1}}\mathbb{E}\left[\mathbf{z}_1\right]-\frac{1}{2}\mathbb{E}\left[\mathbf{z}_1^{\rm T}\right]\frac{\partial\mathbf{V}_0^{-1}}{\partial\mathbf{V}_0^{-1}}\mathbb{E}\left[\mathbf{z}_1\right]\\
&=\frac{1}{2}\mathbf{V}_0-\frac{1}{2}\mathbb{E}\left[\mathbf{z}_1\mathbf{z}_1^{\rm T}\right]+\mathbb{E}\left[\mathbf{z}_1\right]\mathbb{E}\left[\mathbf{z}_1^{\rm T}\right]-\frac{1}{2}\mathbb{E}\left[\mathbf{z}_1\right]\mathbb{E}\left[\mathbf{z}_1^{\rm T}\right]\\
&=\frac{1}{2}\left\{\mathbf{V}_0-\left(\mathbb{E}\left[\mathbf{z}_1\mathbf{z}_1^{\rm T}\right]-\mathbb{E}\left[\mathbf{z}_1\right]\mathbb{E}\left[\mathbf{z}_1^{\rm T}\right]\right)\right\}\\
&=\mathbf{0}\\
\therefore \mathbf{V}_0^{\rm new}&=\mathbb{E}\left[\mathbf{z}_1\mathbf{z}_1^{\rm T}\right]-\mathbb{E}\left[\mathbf{z}_1\right]\mathbb{E}\left[\mathbf{z}_1^{\rm T}\right]
\end{align*}
$$
Exercise (13.33)
$$
\begin{align*}
\mathcal{Q}\left(\boldsymbol\theta, \boldsymbol\theta^{\rm old}\right)&=\frac{1}{2}{\rm Tr}\left(\mathbf{A}\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n-1}\mathbf{z}_n^{\rm T}\right]\boldsymbol\Gamma^{-1}\right)+\frac{1}{2}{\rm Tr}\left(\mathbf{A}^{\rm T}\boldsymbol\Gamma^{-1}\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n}\mathbf{z}_{n-1}^{\rm T}\right]\right)-\frac{1}{2}{\rm Tr}\left(\boldsymbol\Gamma^{-1}\mathbf{A}\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n-1}\mathbf{z}_{n-1}^{\rm T}\right]\mathbf{A}^{\rm T}\right)+{\rm const}
\end{align*}
$$
と式変形して$${\mathbf{A}}$$で微分すると,
$$
\begin{align*}
\frac{\partial\mathcal{Q}\left(\boldsymbol\theta, \boldsymbol\theta^{\rm old}\right)}{\partial\mathbf{A}}&=\frac{1}{2}\frac{\partial}{\partial\mathbf{A}}{\rm Tr}\left(\mathbf{A}\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n-1}\mathbf{z}_n^{\rm T}\right]\boldsymbol\Gamma^{-1}\right)+\frac{1}{2}\frac{\partial}{\partial\mathbf{A}}{\rm Tr}\left(\mathbf{A}^{\rm T}\boldsymbol\Gamma^{-1}\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n}\mathbf{z}_{n-1}^{\rm T}\right]\right)-\frac{1}{2}\frac{\partial}{\partial\mathbf{A}}{\rm Tr}\left(\boldsymbol\Gamma^{-1}\mathbf{A}\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n-1}\mathbf{z}_{n-1}^{\rm T}\right]\mathbf{A}^{\rm T}\right)\\
&=\frac{1}{2}\left(\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n-1}\mathbf{z}_n^{\rm T}\right]\boldsymbol\Gamma^{-1}\right)^{\rm T}+\frac{1}{2}\boldsymbol\Gamma^{-1}\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n}\mathbf{z}_{n-1}^{\rm T}\right]-\boldsymbol\Gamma^{-1}\mathbf{A}\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n-1}\mathbf{z}_{n-1}^{\rm T}\right]\\
&=\boldsymbol\Gamma^{-1}\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n}\mathbf{z}_{n-1}^{\rm T}\right]-\boldsymbol\Gamma^{-1}\mathbf{A}\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n-1}\mathbf{z}_{n-1}^{\rm T}\right]\\
&=\mathbf{0}\\
\therefore \mathbf{A}^{\rm new}&=\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n}\mathbf{z}_{n-1}^{\rm T}\right]\left(\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n-1}\mathbf{z}_{n-1}^{\rm T}\right]\right)^{-1}
\end{align*}
$$
$$
\begin{align*}
\mathcal{Q}\left(\boldsymbol\theta, \boldsymbol\theta^{\rm old}\right)&=\frac{N-1}{2}\ln|\boldsymbol\Gamma^{-1}|-\frac{1}{2}{\rm Tr}\left(\boldsymbol\Gamma^{-1}\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n}\mathbf{z}_n^{\rm T}\right]\right)+\frac{1}{2}{\rm Tr}\left(\boldsymbol\Gamma^{-1}\mathbf{A}^{\rm new}\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n-1}\mathbf{z}_n^{\rm T}\right]\right)+\frac{1}{2}{\rm Tr}\left(\boldsymbol\Gamma^{-1}\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n}\mathbf{z}_{n-1}^{\rm T}\right](\mathbf{A}^{\rm new})^
{\rm T}\right)-\frac{1}{2}{\rm Tr}\left(\boldsymbol\Gamma^{-1}\mathbf{A}^{\rm new}\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n-1}\mathbf{z}_{n-1}^{\rm T}\right](\mathbf{A}^{\rm new})^{\rm T}\right)+{\rm const}
\end{align*}
$$
と式変形して$${\boldsymbol\Gamma^{-1}}$$で微分すると,
$$
\begin{align*}
\frac{\partial\mathcal{Q}\left(\boldsymbol\theta, \boldsymbol\theta^{\rm old}\right)}{\partial\boldsymbol\Gamma^{-1}}&=\frac{N-1}{2}\frac{\partial}{\partial\boldsymbol\Gamma^{-1}}\ln|\boldsymbol\Gamma^{-1}|-\frac{1}{2}\frac{\partial}{\partial\boldsymbol\Gamma^{-1}}{\rm Tr}\left(\boldsymbol\Gamma^{-1}\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n}\mathbf{z}_n^{\rm T}\right]\right)+\frac{1}{2}\frac{\partial}{\partial\boldsymbol\Gamma^{-1}}{\rm Tr}\left(\boldsymbol\Gamma^{-1}\mathbf{A}^{\rm new}\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n-1}\mathbf{z}_n^{\rm T}\right]\right)+\frac{1}{2}\frac{\partial}{\partial\boldsymbol\Gamma^{-1}}{\rm Tr}\left(\boldsymbol\Gamma^{-1}\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n}\mathbf{z}_{n-1}^{\rm T}\right](\mathbf{A}^{\rm new})^{\rm T}\right)-\frac{1}{2}\frac{\partial}{\partial\boldsymbol\Gamma^{-1}}{\rm Tr}\left(\boldsymbol\Gamma^{-1}\mathbf{A}^{\rm new}\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n-1}\mathbf{z}_{n-1}^{\rm T}\right](\mathbf{A}^{\rm new})^{\rm T}\right)\\
&=\frac{N-1}{2}\boldsymbol\Gamma-\frac{1}{2}\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n}\mathbf{z}_n^{\rm T}\right]+\frac{1}{2}\mathbf{A}^{\rm new}\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n-1}\mathbf{z}_n^{\rm T}\right]+\frac{1}{2}\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n}\mathbf{z}_{n-1}^{\rm T}\right](\mathbf{A}^{\rm new})^{\rm T}-\frac{1}{2}\mathbf{A}^{\rm new}\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n-1}\mathbf{z}_{n-1}^{\rm T}\right](\mathbf{A}^{\rm new})^{\rm T}\\
&=\mathbf{0}\\
\therefore \boldsymbol\Gamma^{\rm new}&=\frac{1}{N-1}\left(\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n}\mathbf{z}_n^{\rm T}\right]-\mathbf{A}^{\rm new}\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n-1}\mathbf{z}_n^{\rm T}\right]-\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n}\mathbf{z}_{n-1}^{\rm T}\right](\mathbf{A}^{\rm new})^{\rm T}+\mathbf{A}^{\rm new}\sum_{n=2}^N\mathbb{E}\left[\mathbf{z}_{n-1}\mathbf{z}_{n-1}^{\rm T}\right](\mathbf{A}^{\rm new})^{\rm T}\right)
\end{align*}
$$
Exercise (13.34)
$$
\begin{align*}
\mathcal{Q}\left(\boldsymbol\theta, \boldsymbol\theta^{\rm old}\right)&=\frac{1}{2}{\rm Tr}\left(\mathbf{C}\sum_{n=1}^N\mathbb{E}\left[\mathbf{z}_{n}^{\rm T}\right]\mathbf{x}_{n}\boldsymbol\Sigma^{-1}\right)+\frac{1}{2}{\rm Tr}\left(\mathbf{C}^{\rm T}\boldsymbol\Sigma^{-1}\sum_{n=1}^N\mathbf{x}_{n}\mathbb{E}\left[\mathbf{z}_{n}^{\rm T}\right]\right)-\frac{1}{2}{\rm Tr}\left(\boldsymbol\Sigma^{-1}\mathbf{C}\sum_{n=1}^N\mathbb{E}\left[\mathbf{z}_{n}\mathbf{z}_{n}^{\rm T}\right]\mathbf{C}^{\rm T}\right)+{\rm const}
\end{align*}
$$
と式変形して$${\mathbf{C}}$$で微分すると,
$$
\begin{align*}
\frac{\partial \mathcal{Q}\left(\boldsymbol\theta, \boldsymbol\theta^{\rm old}\right)}{\partial\mathbf{C}}&=\frac{1}{2}\frac{\partial}{\partial\mathbf{C}}{\rm Tr}\left(\mathbf{C}\sum_{n=1}^N\mathbb{E}\left[\mathbf{z}_{n}^{\rm T}\right]\mathbf{x}_{n}\boldsymbol\Sigma^{-1}\right)+\frac{1}{2}\frac{\partial}{\partial\mathbf{C}}{\rm Tr}\left(\mathbf{C}^{\rm T}\boldsymbol\Sigma^{-1}\sum_{n=1}^N\mathbf{x}_{n}\mathbb{E}\left[\mathbf{z}_{n}^{\rm T}\right]\right)-\frac{1}{2}\frac{\partial}{\partial\mathbf{C}}{\rm Tr}\left(\boldsymbol\Sigma^{-1}\mathbf{C}\sum_{n=1}^N\mathbb{E}\left[\mathbf{z}_{n}\mathbf{z}_{n}^{\rm T}\right]\mathbf{C}^{\rm T}\right)\\
&=\frac{1}{2}\left(\sum_{n=1}^N\mathbb{E}\left[\mathbf{z}_{n}^{\rm T}\right]\mathbf{x}_{n}\boldsymbol\Sigma^{-1}\right)^{\rm T}+\frac{1}{2}\boldsymbol\Sigma^{-1}\sum_{n=1}^N\mathbf{x}_{n}\mathbb{E}\left[\mathbf{z}_{n}^{\rm T}\right]-\boldsymbol\Sigma^{-1}\mathbf{C}\sum_{n=1}^N\mathbb{E}\left[\mathbf{z}_{n}\mathbf{z}_{n}^{\rm T}\right]\\
&=\boldsymbol\Sigma^{-1}\sum_{n=1}^N\mathbf{x}_{n}\mathbb{E}\left[\mathbf{z}_{n}^{\rm T}\right]-\boldsymbol\Sigma^{-1}\mathbf{C}\sum_{n=1}^N\mathbb{E}\left[\mathbf{z}_{n}\mathbf{z}_{n}^{\rm T}\right]\\
&=\mathbf{0}\\
\therefore \mathbf{C}^{\rm new}&=\left(\sum_{n=1}^N\mathbf{x}_{n}\mathbb{E}\left[\mathbf{z}_{n}^{\rm T}\right]\right)\left(\sum_{n=1}^N\mathbb{E}\left[\mathbf{z}_{n}\mathbf{z}_{n}^{\rm T}\right]\right)^{-1}
\end{align*}
$$
$$
\begin{align*}
\mathcal{Q}\left(\boldsymbol\theta, \boldsymbol\theta^{\rm old}\right)&=\frac{N}{2}\ln|\boldsymbol\Sigma^{-1}|-\frac{1}{2}{\rm Tr}\left(\boldsymbol\Sigma^{-1}\sum_{n=1}^N\mathbf{x}_n\mathbf{x}_n^{\rm T}\right)+\frac{1}{2}{\rm Tr}\left(\boldsymbol\Sigma^{-1}\mathbf{C}^{\rm new}\sum_{n=1}^N\mathbb{E}\left[\mathbf{z}_{n}^{\rm T}\right]\mathbf{x}_{n}\right)+\frac{1}{2}{\rm Tr}\left(\boldsymbol\Sigma^{-1}\sum_{n=1}^N\mathbf{x}_{n}\mathbb{E}\left[\mathbf{z}_{n}^{\rm T}\right](\mathbf{C}^{\rm new})^{\rm T}\right)-\frac{1}{2}{\rm Tr}\left(\boldsymbol\Sigma^{-1}\mathbf{C}^{\rm new}\sum_{n=1}^N\mathbb{E}\left[\mathbf{z}_{n}\mathbf{z}_{n}^{\rm T}\right](\mathbf{C}^{\rm new})^{\rm T}\right)+{\rm const}
\end{align*}
$$
と式変形して$${\boldsymbol\Sigma^{-1}}$$で微分すると,
$$
\begin{align*}
\frac{\partial \mathcal{Q}\left(\boldsymbol\theta, \boldsymbol\theta^{\rm old}\right)}{\partial\boldsymbol\Sigma^{-1}}&=\frac{N}{2}\frac{\partial}{\partial\boldsymbol\Sigma^{-1}}\ln|\boldsymbol\Sigma^{-1}|-\frac{1}{2}\frac{\partial}{\partial\boldsymbol\Sigma^{-1}}{\rm Tr}\left(\boldsymbol\Sigma^{-1}\sum_{n=1}^N\mathbf{x}_n\mathbf{x}_n^{\rm T}\right)+\frac{1}{2}\frac{\partial}{\partial\boldsymbol\Sigma^{-1}}{\rm Tr}\left(\boldsymbol\Sigma^{-1}\mathbf{C}^{\rm new}\sum_{n=1}^N\mathbb{E}\left[\mathbf{z}_{n}^{\rm T}\right]\mathbf{x}_{n}\right)+\frac{1}{2}\frac{\partial}{\partial\boldsymbol\Sigma^{-1}}{\rm Tr}\left(\boldsymbol\Sigma^{-1}\sum_{n=1}^N\mathbf{x}_{n}\mathbb{E}\left[\mathbf{z}_{n}^{\rm T}\right](\mathbf{C}^{\rm new})^{\rm T}\right)-\frac{1}{2}\frac{\partial}{\partial\boldsymbol\Sigma^{-1}}{\rm Tr}\left(\boldsymbol\Sigma^{-1}\mathbf{C}^{\rm new}\sum_{n=1}^N\mathbb{E}\left[\mathbf{z}_{n}\mathbf{z}_{n}^{\rm T}\right](\mathbf{C}^{\rm new})^{\rm T}\right)\\
&=\frac{N}{2}\boldsymbol\Sigma-\frac{1}{2}\sum_{n=1}^N\mathbf{x}_n\mathbf{x}_n^{\rm T}+\frac{1}{2}\mathbf{C}^{\rm new}\sum_{n=1}^N\mathbb{E}\left[\mathbf{z}_{n}^{\rm T}\right]\mathbf{x}_{n}+\frac{1}{2}\sum_{n=1}^N\mathbf{x}_{n}\mathbb{E}\left[\mathbf{z}_{n}^{\rm T}\right](\mathbf{C}^{\rm new})^{\rm T}-\frac{1}{2}\mathbf{C}^{\rm new}\sum_{n=1}^N\mathbb{E}\left[\mathbf{z}_{n}\mathbf{z}_{n}^{\rm T}\right](\mathbf{C}^{\rm new})^{\rm T}\\
&=\mathbf{0}\\
\therefore \boldsymbol\Sigma^{\rm new}&=\frac{1}{N}\left(\sum_{n=1}^N\mathbf{x}_n\mathbf{x}_n^{\rm T}-\mathbf{C}^{\rm new}\sum_{n=1}^N\mathbb{E}\left[\mathbf{z}_{n}^{\rm T}\right]\mathbf{x}_{n}-\sum_{n=1}^N\mathbf{x}_{n}\mathbb{E}\left[\mathbf{z}_{n}^{\rm T}\right](\mathbf{C}^{\rm new})^{\rm T}+\mathbf{C}^{\rm new}\sum_{n=1}^N\mathbb{E}\left[\mathbf{z}_{n}\mathbf{z}_{n}^{\rm T}\right](\mathbf{C}^{\rm new})^{\rm T}\right)
\end{align*}
$$