統計検定準1級対策④:変数変換
はじめに
統計検定準1級対策第4段です. 今回は『統計学実践ワークブック』第4章 変数変換の範囲にある次の分野についてまとめます.
$${1}$$変数の変数変換
$${2}$$変数の変数変換
Box-Cox変換
なお, ロジット変換, ロジスティック変換, プロビット変換は第18章で学ぶため, 本記事では割愛する.
1. 1変数の変数変換
性質
$${X, Y}$$を連続型確率変数$${f_X(x), f_Y(y)}$$をそれぞれ$${X, Y}$$の確率密度関数とし, $${y = g(x)}$$が単調な関数であるとする. このとき, $${g}$$の逆関数$${x = g^{-1}(y)}$$が存在する. $${g^{-1} (y)}$$が微分可能であれば次が成り立つ.
$$
f_Y(y) = f_X (g^{-1}(y)) \left|\frac{dx}{dy} \right| = f_X (g^{-1}(y)) \left|\frac{1}{\frac{dy}{dx}} \right| = f_X (g^{-1}(y)) \left|\frac{1}{g^\prime (g^{-1}(y))} \right|
$$
証明
$${(proof)}$$
積分の変数変換をすればよい. $${y = g(x)}$$が単調増加と仮定すると,
$$
\begin{align}
\begin{array}{c|ccc|}
Y & - \infty & \rightarrow & y \\ \hline
X & - \infty & \rightarrow & x = g^{-1} (y)
\end{array} \notag
\end{align}
$$
となる. いま
$$
\begin{align}
\int_{- \infty}^y f_Y (t) dt &= \int_{- \infty}^{x} f_X (s) g^{\prime} (s) ds \notag
\end{align}
$$
が成り立っている. $${X}$$の累積密度関数を$${F_X}$$とし, 両辺を$${y}$$で微分すると
$$
\begin{align}
f_Y (y) &= \frac{\partial}{dy} F_X (x) \notag \\
&= \frac{d}{dx} F_X (x) \frac{dx}{dy} \notag \\
&= f_X (x) \frac{1}{\frac{dy}{dx}} \notag \\
&= f_X (x) \frac{1}{g^{\prime} (x)} \notag \\
&= f_X (g^{-1} (y)) \frac{1}{g^{\prime} (g^{-1} (y))} \notag
\end{align}
$$
となり, $${y = g(x)}$$が単調増加のとき, $${f_Y(y) = f_X (g^{-1}(y)) \left|\frac{1}{g^\prime (g^{-1}(y))} \right|}$$が成り立っていることを示すことができた.
$${y = g(x)}$$が単調減少のとき, 積分範囲と符号に注意すると同じ議論により成り立つことが示せる.
以上より題意を示すことができた. $${\square}$$
例題.
確率変数$${X}$$は正規分布$${N(\mu, \sigma^2)}$$に従い, その確率密度関数
$$
f(x) = \frac{1}{\sqrt{2 \pi} \sigma} e^{- \frac{(x - \mu)^2}{2 \sigma^2}}
$$
であるとする. このとき, 確率変数$${Y = e^X}$$とする.
$${Y}$$の期待値を求めよ.
$${Y}$$の分散を求めよ.
$${Y}$$の確率密度関数を求めよ.
(解)
モーメント母関数を用いて求める. $${X}$$のモーメント母関数は
より$${X}$$のモーメント母関数を求め, $${t = 1}$$を代入すればよい.
$${M_X (t) = E(e^{tX})}$$より
$$
\begin{align}
E(e^{tX}) &= \int_{- \infty}^\infty e^{tx} \cdot \frac{1}{\sqrt{2 \pi} \sigma} e^{- \frac{(x - \mu)^2}{2 \sigma^2}} dx \notag \\
&= \frac{1}{\sqrt{2 \pi} \sigma} \int_{- \infty}^\infty exp(tx - \frac{x^2 - 2 \mu x + \mu^2}{2 \sigma^2}) dx \notag \\
&= \frac{1}{\sqrt{2 \pi} \sigma} \int_{- \infty}^\infty exp(- \frac{x^2 - 2 (\mu + t \sigma^2) x + \mu^2}{2 \sigma^2}) dx \notag \\
&= \frac{1}{\sqrt{2 \pi} \sigma} \int_{- \infty}^\infty exp(- \frac{(x - (\mu + t \sigma^2))^2 - 2t \mu \sigma^2 - t^2 \sigma^4}{2 \sigma^2}) dx \notag \\
&= \frac{1}{\sqrt{2 \pi} \sigma} \int_{- \infty}^\infty exp(- \frac{(x - (\mu + t \sigma^2))^2}{2 \sigma^2}) exp(t \mu + \frac{t^2 \sigma^2}{2}) dx \notag \\
&= exp(t \mu + \frac{t^2 \sigma^2}{2}) \times \frac{1}{\sqrt{2 \pi} \sigma} \int_{- \infty}^\infty exp(- \frac{(x - (\mu + t \sigma^2))^2}{2 \sigma^2}) dx \notag \\
&= exp(t \mu + \frac{t^2 \sigma^2}{2}) \notag
\end{align}
$$
したがって, $${t = 1}$$ を代入すると
$$
E(Y) = E(e^X) = e^{\mu + \frac{\sigma^2}{2}}
$$
となる.
2.
$${E(e^{tX}) = exp(t \mu + \frac{t^2 \sigma^2}{2})}$$に$${t = 2}$$を代入すると
$$
E(Y^2) = E((e^X)^2) = E(e^{2X}) = e^{2 \mu + \frac{2^2 \sigma^2}{2}} = e^{2 \mu + 2 \sigma^2}
$$
よって,
$$
\begin{align}
V(Y) &= E(X^2) - (E(X))^2 \notag \\
&= e^{2 \mu + 2 \sigma^2} - (e^{\mu + \frac{\sigma^2}{2}})^2 \notag \\
&= e^{2 \mu + 2 \sigma^2} - e^{2 \mu + \sigma^2} \notag \\
&= e^{2 \mu + \sigma^2} (e^{\sigma^2} - 1) \notag
\end{align}
$$
となる.
3.
$${x = \log y}$$である. いま, $${Y}$$の確率密度関数を$${g(y)}$$とする. $${Y = e^x > 0}$$ より累積分布関数を考えると
$$
\int_{- \infty}^x f(s) ds = \int_{0}^y g(t)dt
$$
ただし, $${s = \log t, t > 0}$$ である. $${\frac{ds}{dt} = \frac{1}{t}}$$より
$$
\int_{- \infty}^x f(s) ds = \int_{- \infty}^y f(\log t) \cdot \frac{1}{t} dt
$$
したがって, 両辺を$${y}$$で微分すると
$$
\begin{align}
g(y) &= f(\log y) \cdot \frac{1}{y} \notag \\
&= \frac{1}{\sqrt{2 \pi} \sigma y} e^{- \frac{(\log y - \mu)^2}{2 \sigma^2}} \notag
\end{align}
$$
注.
ほんとうは$${\frac{1}{t}}$$に絶対値が必要である. 今回は$${t > 0}$$が確定しているため, つけていない.
上記の等式を使えば累積分布関数を使わなくてもいきなり$${g(y)}$$が求められるが, 分からなくならないように導出から書いた.
2. 2変数の変数変換
2変数の変数変換には2重積分の変数変換が使われる.
2重積分の変数変換
$${D \subset \mathbb{R}^2}$$ とし, $${x, y: D \rightarrow \mathbb{R}}$$ は $${C^1}$$ 級とする. また, $${x = x(u, v), y = y(u, v)}$$ により$${xy}$$平面上の領域$${D}$$と$${uv}$$平面上の領域$${E}$$が$${1}$$対$${1}$$対応しているとする. このとき, $${D}$$上広義可積分な連続関数$${f(x, y)}$$に対して, 次の等式が成り立つ.
$$
\displaystyle{\int_D f(x, y) dxdy = \int_E f(x(u, v), y(u, v)) |J(u, v)| dudv}
$$
ただし, $${|J(u, v)|}$$ はヤコビアンであり, 次で表される.
$$
\begin{align}
|J(u, v)| = \left| det
\begin{pmatrix}
\frac{\partial x}{\partial u} & \frac{\partial x}{\partial v} \\
\frac{\partial y}{\partial u} & \frac{\partial y}{\partial v} \\
\end{pmatrix}
\right| \notag
\end{align}
$$
1変数の場合との比較
$${1}$$変数の場合を思い出すと
$$
f_Y(y) = f_X (g^{-1}(y)) \left|\frac{dx}{dy} \right| = f_X (g^{-1}(y)) \left|\frac{1}{\frac{dy}{dx}} \right| = f_X (g^{-1}(y)) \left|\frac{1}{g^\prime (g^{-1}(y))} \right|
$$
であった. ヤコビアンの部分が$${\left|\frac{dx}{dy} \right|}$$にあたるが, 変換前の変数を変化後の変数で微分していることが分かる.
$${2}$$変数以上の場合の変数変換も同様になっていることが確認できる.
証明
証明は下記サイトに任せます。
例題
確率変数$${X, Y}$$が独立でそれぞれパラメータ$${\lambda}$$の指数分布に従う. つまり, 確率密度関数が$${f(x) = \lambda e^{- \lambda x}}$$で与えられるとする. このとき, $${X + Y}$$の確率密度関数を求めよ.
(解)
$${X, Y}$$の確率密度関数$${f_X(x), f_Y(y)}$$ はともに$${f(x)}$$である.
$${Z = X + Y, W = Y}$$とする. いま, $${(Z, W)}$$の同時確率密度関数を$${g}$$とすると
$$
g(z, w) = f_X(x) f_Y (y) |J(z, w)|
$$
ここで, $${J(z, w)}$$はヤコビアンである. $${X = Z - Y = Z - W, Y = W}$$であるから
$$
\begin{align}
|J(z, w)| = \left| det
\begin{pmatrix}
\frac{\partial x}{\partial z} & \frac{\partial x}{\partial w} \\
\frac{\partial y}{\partial z} & \frac{\partial y}{\partial w} \\
\end{pmatrix}
\right| =
\left| det
\begin{pmatrix}
1 & -1 \\
0 & 1 \\
\end{pmatrix}
\right|
= 1 \notag
\end{align}
$$
となる. よって,
$$
g(z, w) = f_X(x) f_Y (y) = f_X(z - w) f_Y (w) = \lambda e^{- \lambda (z - w)} \times\lambda e^{- \lambda w} = \lambda^2 e^{- \lambda z}
$$
求める関数は周辺確率$${g(z)}$$である. 指数分布より$${X > 0, Y > 0}$$であるため, $${Z - W > 0, W > 0}$$となる. よって, $${0 < W < Z}$$であるから
$$
g(z) = \int_0^z g(z, w) dw = \int_0^z \lambda^2 e^{- \lambda z} dw = \lambda^2 z e^{- \lambda z}
$$
したがって,
$$
g(X + Y) = \lambda^2 (x + y) e^{- \lambda (x + y)}
$$
となる.
3. Box-Cox変換
べき乗変換と対数変換をひとまとめにした変換がBox-Cox変換である. 非対称であるなど正規分布からずれている非負データ$${x}$$を正規分布に近づける.
定義
パラメータ$${\lambda}$$に対し,
$$
\begin{align}
f(x) &= \begin{cases}
\frac{x^{\lambda} - 1}{\lambda} & \text{if } \lambda \neq 0 \\
\log x & \text{if } \lambda = 0
\end{cases} \notag
\end{align}
$$
でされる変換をBox-Cox変換という.
性質
Box-Cox変換は次の性質をもつ.
$${x = 1}$$は$${0}$$に移される
$${x = 1}$$での微分は$${1}$$になる.
証明
$${(proof)}$$
$${x = 1}$$のとき,
$$
\frac{1^\lambda - 1}{\lambda} = 0 \\
\log 1 = 0
$$
よって, 任意の$${\lambda}$$において, $${x = 1}$$は$${0}$$に移される.
また,
$$
\left(\frac{x^\lambda - 1}{\lambda} \right)^\prime = x^{\lambda - 1} \\
(\log x)^\prime = \frac{1}{x}
$$
よって, $${x = 1}$$で微分した値は$${1}$$になる. $${\square}$$
練習問題
練習1
確率変数$${X}$$と$${Y}$$が同時確率密度関数
$$
f_{X,Y}(x, y) = \begin{cases} cxy & 0 \leq x \leq 2, 0 \leq y \leq 1 \\ 0 & other \end{cases}
$$
に従うとする。ここで、c は定数である。
新しい確率変数$${U}$$と$${V}$$を$${U=X+Y, V=X−Y}$$と定義する. 以下の問いに答えよ.
定数$${c}$$の値を求めよ.
新しい確率変数$${U}$$と$${V}$$の同時確率密度関数$${f_{U,V} (u,v)}$$を求めよ.
確率変数$${V}$$の周辺確率密度関数$${f_V (v)}$$を求めよ.
(解)
1.
$$
\begin{align}
\int_0^2 \int_0^1 cxy dy dx &= 1 \notag \\
\int_0^2 \left[\frac{1}{2} cxy^2 \right]_{y = 0}^{y = 1} &= 1 \notag \\
\int_0^2 \frac{1}{2} cx &= 1 \notag \\
\left[\frac{1}{4} cx^2 \right]_0^2 &= 1 \notag \\
c &= 1 \notag
\end{align}
$$
2.
$${u=x+y, v=x−y}$$より$${x=\frac{u+v}{2}, y=\frac{u−v}{2}}$$となる. ヤコビアン$${|{J(u, v)}|}$$は
$$
\begin{align}
|{J(u, v)}| &= \left|det\begin{pmatrix} \frac{\partial x}{\partial u} & \frac{\partial x}{\partial v} \\ \frac{\partial y}{\partial u} & \frac{\partial y}{\partial v} \end{pmatrix} \right| \notag \\
&= \left|det\begin{pmatrix} \frac{1}{2} & \frac{1}{2} \\
\frac{1}{2} & - \frac{1}{2} \end{pmatrix} \right| \notag \\
&= \left|\frac{1}{2} \cdot (- \frac{1}{2}) - \frac{1}{2} \cdot \frac{1}{2} \right| \notag \\
&= \frac{1}{2} \notag
\end{align}
$$
となる. よって,
$$
\begin{align}
f_{U,V}(u, v) &= f_{X,Y}(x, y) \cdot |J(u, v)| \notag \\
&= xy \cdot \frac{1}{2} \notag \\
&= \frac{1}{2} xy \notag \\
&= \frac{1}{2} \cdot \frac{u+v}{2}\cdot \frac{u−v}{2} \notag \\
&= \frac{1}{8} (u^2 - v^2) \notag
\end{align}
$$
3.
$${u = x + y}$$であり$${0 \leq x \leq 2, 0 \leq y \leq 1}$$であった. よって, $${0 \leq u \leq 3}$$である.
$$
\begin{align}
f_V (v) &= \int_{-\infty}^{\infty} f_{U,V}(u, v) du \notag \\
&= \int_{0}^{3} \frac{1}{8} (u^2 - v^2) du \notag \\
&= \left[ \frac{1}{3} u^3 - v^2 \right]_0^3 \notag \\
&= 9 - v^2 \notag
\end{align}
$$
よって, $${f_V (v) = - v^2 + 9}$$となる.