t分布の確率密度関数の導出

母平均の差を検定する際に用いるt統計量はt分布に従う。今回はそのt分布の確率密度関数の導出をしてみる。

導出はそこまで難しくなく、単純に変数変換によって求められる。

まず、t分布の定義を確認する。
UとVが互いに独立な確率変数で、Uは標準正規分布、Vは自由度mのカイ二乗分布に従うとき、

$$
T = \frac{U}{\sqrt{V/m}}
$$

は自由度mのt分布に従う。
次に、t統計量の定義は以下のようになる。

$$
T = \frac{\sqrt{n}(\bar X -\mu)}{s} \\
s^2 = \frac{1}{n-1} \left( \sum_{i=1}^n (X - \bar X)^2 \right)
$$

標本平均から母平均を引いて偏差の平方和をn-1で割ったもので割っている。上記の式を更に変形して、

$$
T = \frac{\frac{(\bar X -\mu)}{\sigma/\sqrt{n}}}{\sqrt{s^2/\sigma^2}} \\
$$

とすると、$${U=\frac{(\bar X -\mu)}{\sigma/\sqrt{n}},  V=(n-1)s^2/\sigma^2}$$とおいてTがt分布に従うことがわかる。ではここから、変数変換によってt分布の確率密度関数を求めていく。

変数変換では、U, VをそれぞれT, Vに変換する。

$$
T = \frac{U}{\sqrt{V/m}} \\
V = V
$$

ヤコビ行列の行列式は以下のようになる。

$$
\sqrt{V/m} * 1 - 0 = \sqrt{V/m}
$$

U, Vの同時確率密度関数を求め、それをT, Vについて変換していく。そのあとVについて積分していきTの周辺化確率密度関数を求める。

$$
f_{U, V} (u, v) = \frac{1}{\sqrt{2\pi}}e^{-\frac{u^2}{2}} \cdot \frac{1}{2^{m/2}\Gamma(m/2)}v^{(m/2)-1}e^{-v/2} \\
f_{T, V} (t, v) = \sqrt{v/m} \cdot \frac{1}{\sqrt{2\pi}}e^{-\frac{vt^2}{2m}} \cdot \frac{1}{2^{m/2}\Gamma(m/2)}v^{(m/2)-1}e^{-v/2} \\
f_T(t) = \frac{1}{2^{m/2} \sqrt{2\pi m}\Gamma(m/2)} \int_0^{\infin} \sqrt{v} e^{-\frac{vt^2}{2m}} v^{(m/2)-1}e^{-v/2}  dv \\
= \frac{1}{2^{m/2} \sqrt{2\pi m}\Gamma(m/2)} \int_0^{\infin} v^{((m+1)/2)-1}e^{-v(t^2+m)/2m}  dv \\
= \frac{1}{2^{m/2} \sqrt{2\pi m}\Gamma(m/2)} 2^{(m+1)/2}\Gamma\left( \frac{m+1}{2} \right) \left( 1+\frac{t^2}{m} \right)^{-(m+1)/2} \\
= \frac{\Gamma\left( \frac{m+1}{2} \right)}{\sqrt{\pi m}\Gamma(m/2)} \left( 1+\frac{t^2}{m} \right)^{-(m+1)/2}
$$

以上でt分布を求めることができた。
手順は単純だったが、式変形はまあまあ複雑でめんどくさかった。
特に、途中で少し省略しているが積分の計算でガンマ関数の変形を変数変換を混ぜて使う必要があったところなど。

いいなと思ったら応援しよう!