短期市場変化:Markov Switching Model

Markov Switching Model(MSM)は、時系列データの状態が時間の関数で変化するようにモデル化したRegime-Switching Modelsの一つで、次の時点の状態 $${s_t}$$ は直前の状態$${s_{t-1}}$$にのみ依存するマルコフ過程を前提にしている。
特に、金融市場や経済指標のように状態が異なる複数のレジーム(例えば好景気・不景気など)を持つデータに適用される。構造的な変化に注目する長期市場変化の判定には向かないが、MSM は、金融市場やマクロ経済の動きを解析する強力な手法である。

モデル定義

ある時刻$${t}$$の市場の時系列データ$${y_t}$$は、市場の状態変数$${s_t}$$に依存する平均値$${\mu_{s_t}}$$と分散の$${\sigma_{s_t}}$$によって、以下のように与えられる。
$${r_t=\mu_{s_t}+\epsilon_{s_t}, \ \epsilon_{s_t}\sim \mathcal{N}(0,\sigma_{s_t}^2)}$$
ここで、状態変数 $${s_t}$$ は市場の状態を示し、好景気と不景気の2状態で市場状態を分ける場合、$${s_t \in \{0,1\}}$$、上昇・停滞・下降の3状態であれば、$${s_t \in \{-1,0,1\}}$$と取ることができる。
この現時点の市場状態から次の時点の市場状態への遷移行列は、$${k}$$状態として、
$${P=\begin{bmatrix}p_{00} &p_{01} &\cdots &p_{0k} \\p_{10} &p_{11} &\cdots &p_{1k}\\ \vdots &\vdots &\ddots &\vdots \\p_{(k-1)0} &p_{(k-1)1} &\cdots &p_{(k-1)(k-1)} \\ \end{bmatrix}}$$
で与えられる。$${p_{ij}}$$は、$${s_t=i}$$から$${s_t=j}$$へ遷移する確立であり、
$${\Sigma^{k-1}_{j=0} p_{ij}=1,\ i=0,\cdots k-1 }$$となる。

パラメータ推定

$${{\bm \mu}:(\mu_0, \cdots,\mu_{k-1}),{\bm \sigma}:(\sigma_0, \cdots,\sigma_{k-1}),P}$$のパラメータの推定には、最尤推定(MLE) または EMアルゴリズム(Expectation-Maximization) を使用する。

MLE
時系列データ $${{{\bm y} =(y_1,y_2,...,y_T)}}$$が与えられたとき、各時点でのレジーム ${s_t}$ を考慮した完全データの尤度関数は以下のように表される。
$${L(θ)=P(s_1)∏_{t=2}^TP(s_t∣s_{t−1})∏_{t=1}^TP(y_t∣s_t,{\bm \theta} )}$$
ここで、$${P(s_1)}$$は初期状態の確率で、$${P(s_t∣s_{t−1})}$$は遷移確率で、遷移行列として与えられている。$${P(y_t | s_t, {\bm \theta})}$$は、各状態における確率密度で正規分布で与えられ、
$${P(y_t | s_t=i)=\frac{1}{\sqrt{2\pi\sigma_i^2}} \exp \left( -\frac{(y_t - \mu_i)^2}{2\sigma_i^2} \right)}$$
である。
パラメータ推定はこの尤度を最大化するパラメータを選ぶことで可能になるが、$${s_t}$$ は観測されない隠れ変数であるため、直接最尤推定を行うのは困難である。そのため、一般には EMアルゴリズム が用いられる。

EM法
EM法では、隠れた観測されない変数がある場合、現時点でのパラメータを使い、その変数の事後確立を求め、これを用いてパラメータを更新する2ステップを繰り返し、パラメータ推定を行う。
各時点の状態が$${s_t=i}$$であるフィルタリング確率$${P(s_t = i | y_1, ..., y_t) }$$をForward Algorithmを使用し求める。
$${P(s_t = i | y_1, ..., y_t) = \frac{ P(y_t | s_t = i) \sum_{j} P(s_t = i | s_{t-1} = j) P(s_{t-1} = j | y_1, ..., y_{t-1}) }{P(y_t | y_1, ..., y_{t-1})}}$$
これを用いて、各時点の事後確率を求める:
$${P(s_t = i | y) \approx \frac{ P(y_t | s_t = i) P(s_t = i|y_1,\cdots y_t) }{ \sum_{j} P(y_t | s_t = j) P(s_t = j) }}$$
この事後確率を重みとして、各パラメータ推定を更新する。
$${\mu_i =\displaystyle{ \frac{\sum_{t=1}^{T} P(s_t = i | {\bm y}) y_t}{\sum_{t=1}^{T} P(s_t = i | {\bm y})}}}$$
$${\sigma_i^2 = \displaystyle{\frac{\sum_{t=1}^{T} P(s_t = i | {\bm y}) (y_t - \mu_i)^2}{\sum_{t=1}^{T} P(s_t = i | {\bm y})}}}$$
$${p_{ij} =\displaystyle{ \frac{\sum_{t=1}^{T-1} P(s_t = i, s_{t+1} = j | {\bm y})}{\sum_{t=1}^{T-1} P(s_t = i | {\bm y})}}}$$
これを収束するまで行う。

状態数の決定

状態数 $${k}$ は大きすぎると過学習、小さすぎると重要な市場の状態を見落とす可能性がある。そのため、尤度を用いた評価指標 AIC(赤池情報量基準) および BIC(ベイズ情報量基準) を用いてモデルの適合度を評価する。
上記で求めた尤度$${L}$$を用い、
$${{\bf \theta}=(\mu, \sigma, P)}$$の総数を$${p}$$、データのサンプル長を$${N}$$とすると、赤池情報量基準のAICは、
$${AIC=-2\log L +2p}$$
で与えられ、ベイズ情報量基準のBICは、
$${BIC=-2\log L + p\log N}$$
となる。
BIC は、サンプル数 $${N}$$ でパラメータ数に対してより厳しいペナルティを与えるため、AIC よりも単純なモデルを選びやすい。


いいなと思ったら応援しよう!