計算論的神経科学 第3章-1
「計算論的神経科学」(田中宏和)の第3章(〜p66)についてメモ書きする。他の動物に対しヒトは新たな環境に対する適応能力が非常に高い。本章では運動適応の過程を記述する状態空間モデル及びその応用について記述されている。
状態空間モデル
状態空間モデルとは、時間発達過程と観測過程をモデル化したもので、時間発達過程は運動方程式が記述する運動(i.e., 現在の状態/エンジンなどの制御信号より次の時間の状態を計算)にあたり、一方観測過程は観測装置や方法に依存(i.e., センサーを用いたロケット自己の位置/速度計測)する。これらの物理や制御工学の知見は、身体制御問題の定式化に利用することができる。
状態変数は系の状態を記述するのに対し、観測変数は時間微分を含まない代数方程式として表される。運動方程式m・d^x2/dt^2=Fを再定義し一階の時間微分のみを含むようにするため、状態変数ベクトルを導入すると(3.1)となる。これは、高次の微分に対しより高次元の状態変数を導入することで可能となる。一方、観測方程式について状態変数xを脳の内部状態、観測変数zを四肢の位置などの運動出力とみなすと、運動生成のモデルと考えることができる(3.2)。また、一般的に工学に対し身体運動では観測変数の方が次元が高い。
時刻tが連続値をとる場合、状態空間モデルは(3.3)式とおけ、初期値と制御信号が与えられたとき積分を用いて(3.4)式となる。本に詳しい導出方法が記載されていなかったのでこのページの状態遷移行列の性質を参考にしながら(3.4)式を算出する。
初期状態x_0に対しx=e^(At)x_oとおいて時間微分すると
dx/dt=Ae^(At)x_0 ...①
状態遷移行列の性質より
x(0)=e^(A・0)x_0=x_0
であるため①式は微分方程式dx/dt=Ax、x(0)=x_0の解である。
これより時間Tにおける状態量がx(T)のとき、時間tにおける状態量x(t)は
x(t)=e^{A(t-Y)}x(T)
であり
x(t)=e^(At)p(t)と仮定すると ...②
dx/dt=Ae^(At)dp/dt+e^(At)dp/dt
これよりdx/dt=Ax+Buとすると
e^(At)dp/dt=Bu
状態遷移行列の性質を用いて
dp/dt=e^(-At)Bu
でTについて積分して
p(t)=∫[0,t]e^(AT)Bu(T)dT
が得られる。これより
x=e^(At)∫[0,t]e^(-AT)Bu(T)dT=∫[0,t]eA^(t-T)Bu(T)dT (∵②)
以上より(3.4)式
X(t)=e^(At)x(0)+∫[0,t]eA^(t-t')Bu(t')dt'
が得られる。
一方離散時間である場合、dtの間隔で時間を離散化すると(3.4)より(3.5)であり、(3.6)が得られる。(3.6)は今の状態に制御信号が加わったものと解釈すれば理解が容易だろう。
状態空間モデルの可制御性と可観測性
状態空間モデルが適切な性質を保持するため可制御性及び可観測性を組み込む必要で、グラム行列はA*Aの正方行列のことである。
可制御性.(3.9)式は式内のx_(m-1)に時系列を一つ繰り下げたx_(m-2)を代入し、それをさらに繰り下げるを繰り返すことで得られる。また空間を張るとは変数を全て設定しベクトルを定義するということである。
ケイリーハミルトンの定理とは正方行列は固有方程式を満たすことでAの固有多項式はp(λ):=det(A−λI)(λはスカラー量、detは行列式)を満たす。
固有多項式をdet(A−λI)=∅(λ)とおき、Aが正方行列のとき
P'AP=diag(λ_1, λ_2, ..., λ_n)となる正則行列Pが存在する。(diag(λ_1, λ_2, ..., λ_n)は対角行列で対角成分にAの固有値λ_1, λ_2, ..., λ_nが並んでいる。)
これより
P'A^kP=diag(λ^k_1, λ^k_2, ..., λ^k_n)
であり、また線形結合で
P'∅(A)P=diag(∅_(λ_1), ∅_(λ_2), ..., ∅_(λ_n))...①
となるが、λ_1はAの固有値なので∅_(λ_1)=0
よって①式の右辺はゼロ行列で
P'∅(A)P=0
で
∅(A)=0
(3.10)式について、n*(mn)次元の可制御性行列(mnは文字通りm*nで行列的な意味ではない)で、ランクはBの0ベクトルでない行の個数のことである。CC’が非特異であることは逆行列を持つことを示す。(3.11)式は可制御性グラム行列 W_c(t_1, t_0)が状態遷移行列の性質及び逆行列を持つこと両方を満たす。(3.11)式の算出は以下の通りである。
AW_c+W_cA' =∫[0,∞]Ae^(At)BB'e^(A't)dt+∫[0,∞]e^(At)BB'e^(A't)A'dt
=∫[0,∞]d/dt(e^(At)BB'e^(A't))dt
=e^(At)BB'e(A't)|[t=0,∞]
=0-BB' (∵t=∞でe^(At)=0)
=-BB'
可観測性. 可観測とは(ある一時刻ではない)n個の状態の観測量から初期条件を一位に決定できることで観測方程式Z=Cxに式(3.9)を代入すると初期条件及び制御信号を用いた形に変形できる(3.13)。これを各時間ステップに対して行列の形にしたのが(3.14)で、可観測なのでzとuは既知。(3.14)よりX_0を解くと(3.16)となり、可観測であるためにはx_0を決めるため"可観測性行列がランクnを持つ"or"O'Oが非特異"が成り立てば良い。
この記事が気に入ったらサポートをしてみませんか?