「因果推論の科学」を読んで

因果計算法は以下の二つの要素からなる
①因果ダイアグラム・・・問題となる状況についてすでにわかっていることを整理するのに使う。
点と矢印からなる簡単な図。
点は対象となる量(変数)
矢印は変数間の因果関係を表現


②記号言語・・・その状況について知りたいことを表現するのに使う(代数式に似ている)

母分散が未知である場合、母平均の区間推定は次のように行われます。
まず、標本平均 $\bar{X}$ と標本サイズ $n$ を計算します。そして、母分散が未知であるため、標本分散 $S^2$ を用いて、母平均 $\mu$ の推定値として、以下の式を用います。
$$\hat{\mu}=\bar{X}$$
次に、標準誤差 $SE$ を求めます。標準誤差は、以下の式で求められます。
$$SE=\frac{S}{\sqrt{n}}$$
ここで、標本分散 $S^2$ は以下の式で求められます。
$$S^2=\frac{\sum_{i=1}^n(X_i-\bar{X})^2}{n-1}$$
最後に、信頼係数 $t_{\alpha/2}$ を用いて、母平均の信頼区間を求めます。信頼係数は、信頼水準を表すパラメータであり、一般的に95%信頼区間を用いることが多いです。95%信頼区間の信頼係数は、自由度 $n-1$ のt分布を用いて求められます。
このとき、母平均の信頼区間は、以下の式で求められます。
$$\bar{X}\pm t_{\alpha/2} \times \frac{S}{\sqrt{n}}$$
ここで、$\pm$ の記号は、標本平均 $\bar{X}$ を中心とした、信頼区間が左右に広がることを表しています。この式によって求められた信頼区間は、母平均 $\mu$ が含まれる確率が95%であると解釈することができます。
ただし、母分散が未知であるため、標本分散 $S^2$ を用いているため、母分散が十分に大きい場合や、標本サイズ $n$ が十分に大きい場合には、正規分布を用いた場合とほぼ同じ結果が得られます。

母分散が既知である場合、母平均の区間推定は次のように行われます。

まず、標本平均 $\bar{X}$ と標本サイズ $n$ を計算します。そして、母分散 $\sigma^2$ が既知であるため、母平均 $\mu$ の推定値として、以下の式を用います。

$$\hat{\mu}=\bar{X}$$

次に、標準誤差 $SE$ を求めます。標準誤差は、母分散を既知とするため、以下の式で求められます。

$$SE=\frac{\sigma}{\sqrt{n}}$$

最後に、信頼係数 $z_{\alpha/2}$ を用いて、母平均の信頼区間を求めます。信頼係数は、信頼水準を表すパラメータであり、一般的に95%信頼区間を用いることが多いです。95%信頼区間の信頼係数は、$z_{\alpha/2}=1.96$ です。

このとき、母平均の信頼区間は、以下の式で求められます。

$$\bar{X}\pm z_{\alpha/2} \times \frac{\sigma}{\sqrt{n}}$$

ここで、$\pm$ の記号は、標本平均 $\bar{X}$ を中心とした、信頼区間が左右に広がることを表しています。この式によって求められた信頼区間は、母平均 $\mu$ が含まれる確率が95%であると解釈することができます。


この記事が気に入ったらサポートをしてみませんか?