Beta分布に従う確率変数の期待値と分散

$${\alpha}$$、$${\beta}$$を正整数としたとき、連続一様分布$${U(0,1)}$$に従う$${\alpha+\beta-1}$$個の確率変数の内、その値が小さい方から$${\alpha}$$番目(大きい方から$${\beta}$$番目)の$${x}$$が従うのがBeta分布であり、$${Be(\alpha,\beta)}$$と表す。
Beta関数は
$${B(\alpha,\beta)=\displaystyle{\int^1_0x^{\alpha-1}(1-x)^{\beta-1}dx}}$$と表され、これを使ってBeta分布に従う確率変数の確率密度関数は
$${f(x)=\displaystyle{\frac{x^{\alpha-1}(1-x)^{\beta-1}}{B(\alpha,\beta)}}}$$
で与えられ、定義より$${0<x < 1, \ \alpha, \beta>0}$$である。
ここで、$${x=\sin^2\theta}$$とおけば、
$${B(\alpha,\beta)=\displaystyle{\int^{\frac{\pi}{2}}_0 \sin^{2(\alpha-1)}\theta \cos^{2(\beta-1)} \theta 2\sin\theta\cos\theta d\theta=2\int^{\frac{\pi}{2}}_0 \sin^{2\alpha-1}\theta \cos^{2\beta-1} \theta d\theta}}$$
Gamma関数$${\Gamma(\alpha)=\displaystyle{\int^\infty_0x^{\alpha-1}e^{-x}dx}}$$において、$${x}$$を$${x^2}$$に置き換えれば
$${\Gamma(\alpha)=\displaystyle{2\int^\infty_0x^{2\alpha-1}e^{-x^2}dx}}$$、
$${\Gamma(\alpha)\Gamma(\beta)=\displaystyle{4\int^\infty_0 \int^\infty_0 dxdy x^{2\alpha-1}y^{2\beta-1}e^{-x^2-y^2}}}$$

$${x=r\sin\theta,\ y=r\cos\theta}$$として、$${dxdy=rdrd\theta}$$より、
$${\Gamma(\alpha)\Gamma(\beta)=\displaystyle{4\int^\infty_0 dr \int^{\frac{\pi}{2}}_0d\theta r^{2\alpha+2\beta-1}e^{-r^2}\sin^{2\beta-1}\theta \cos^{2\alpha-1}\theta }}$$
$${=B(\alpha,\beta)\Gamma(\alpha+\beta)}$$
よって、
$${B(\alpha,\beta)=\displaystyle{\frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha+\beta)}}}$$となる。
また、
$${\displaystyle{\int^{\frac{\pi}{2}}_0\sin^{2n}\theta d\theta=\int^{\frac{\pi}{2}}_0\sin^{2(n+\frac{1}{2})-1}\theta\cdot \cos^{2\cdot \frac{1}{2}-1}d\theta =\frac{1}{2} B(n+\frac{1}{2},\frac{1}{2})}}$$
$${\displaystyle{\int^{\frac{\pi}{2}}_0\sin^{2n+1}\theta d\theta=\int^{\frac{\pi}{2}}_0\sin^{2(n+1)-1}\theta\cdot \cos^{2\cdot \frac{1}{2}-1}d\theta =\frac{1}{2} B(n+1,\frac{1}{2})}}$$
である。
期待値は
$${E[x]=\displaystyle{\frac{1}{B(\alpha, \beta)}\int^1_0x\cdot x^{\alpha-1}(1-x)^{\beta-1}dx=\frac{1}{B(\alpha, \beta)}\int^1_0x^{\alpha}(1-x)^{\beta-1}dx}}$$
$${\displaystyle{=\frac{1}{B(\alpha, \beta)}\Big\{\Big[-x^{\alpha}\frac{(1-x)^{\beta}}{\beta}\Big]^1_0 + \int^1_0 \frac{\alpha}{\beta} x^{\alpha-1}(1-x)^\beta dx\Big\} }}$$
$${\displaystyle{=\frac{1}{B(\alpha, \beta)}\frac{\alpha}{\beta}\int^1_0 x^{\alpha-1}(1-x)^{\beta-1}(1-x) dx }}$$
$${\displaystyle{=\frac{1}{B(\alpha, \beta)}\frac{\alpha}{\beta} \Big\{ \int^1_0 x^{\alpha-1}(1-x)^{\beta-1}dx - \int^1_0 x\cdot x^{\alpha-1}(1-x)^{\beta-1}dx \Big\}}}$$
$${\displaystyle{=\frac{1}{B(\alpha, \beta)}\frac{\alpha}{\beta} \{ B(\alpha, \beta)-B(\alpha, \beta)E[x]\} }}$$より、

$${E[x]=\displaystyle{\frac{1}{1+\frac{\alpha}{\beta}} \frac{\alpha}{\beta}=\frac{\alpha}{\alpha+\beta}}}$$

同様な計算によって、
$${E[x^2]=\displaystyle{\frac{1}{B(\alpha, \beta)}\int^1_0x^2\cdot x^{\alpha-1}(1-x)^{\beta-1}dx=\frac{1}{B(\alpha, \beta)}\int^1_0x^{\alpha+1}(1-x)^{\beta-1}dx}}$$
$${\displaystyle{=\frac{1}{B(\alpha, \beta)}\frac{\alpha+1}{\beta}\int^1_0 x^{\alpha-1}(1-x)^{\beta-1}(1-x) dx }}$$
$${\displaystyle{=\frac{1}{B(\alpha, \beta)}\frac{\alpha+1}{\beta} \{ B(\alpha, \beta)E[x]-B(\alpha, \beta)E[x^2]\} }}$$
よって、
$${E[x^2]=\displaystyle{\frac{\alpha+1}{\beta} \frac{\beta}{\alpha+\beta+1}E[x]=\frac{\alpha+1}{\alpha+\beta+1}E[x]}}$$
これから分散は、
$${V[x]=E[x^2]-E^2[x]=\displaystyle{\frac{\alpha}{\alpha+\beta}\Big\{\frac{\alpha+1}{\alpha+\beta+1}-\frac{\alpha}{\alpha+\beta}\Big\}=\frac{\alpha\beta}{(\alpha+\beta)^2(\alpha+\beta+1)}}}$$

$${B(\alpha,\beta)}$$分布に従う乱数のpythonでの実装は、numpy.randomのBetaによって行うことができる。

b=5
a=1.0
s=rand.beta(a, b, size=randnum)
plt.hist(s, 100,label=rf'$\alpha$={a}',alpha=0.6)
a=5.0
s=rand.beta(a, b, size=randnum)
plt.hist(s, 100,label=rf'$\alpha$={a}',alpha=0.6)
a=10.0
s=rand.beta(a, b, size=randnum)
plt.hist(s, 100,label=rf'$\alpha$={a}',alpha=0.6)
plt.title(r'$\mathrm{B}$ distribution $\beta$ =5')
plt.ylabel('Probability')
plt.xlabel('Data')
plt.legend();

この記事が気に入ったらサポートをしてみませんか?