見出し画像

統計学を装備する!10 〜正規分布-課題1〜

確率分布10傑の一つ、正規分布について学び自分なりに理解してまとめた。
(これで正規分布のすべてが分かったとは思わないが)
理解したと使えるとは違う。課題を通じて深めるぞ。
あっ、、、、いややっぱいいわ。

1. 製造業における品質管理

シナリオ: ある工場では、直径が10mmの部品を大量生産している。品質管理チームは、部品の直径が正規分布に従うと仮定している。平均直径は10mm、標準偏差は0.1mmである。

課題:
1-1.直径が10.2mm以上の部品が不良品とされる。全体の中で何%の部品が不良品と考えられるか?
1-2.直径が9.8mmから10.1mmの間に収まる部品の割合は何%か?

学習目標: 正規分布累積分布関数(CDF)を用いて、特定範囲内の確率を計算する方法を学ぶ。

解き方

手順)
1.Zスコアを求める。
2.求めたZスコアの値から累積分布関数(CDF)を使って直径が10.2mm以上の確率を計算する。


Zスコアとは、正規分布における標準化された値であり、あるデータ点が算術平均からどれだけ離れているかを「標準偏差」を単位として表したもの。
Zスコアを使うことで、単位が異なる平均や標準偏差を持つデータセットを比較したり、特定の値が全体の中でどの位置にあるかを確認できる。

Zスコアの公式:

例えば、Zスコア=1とはXが標準偏差1つ分算術平均から上にあることを意味する。(Zスコア=-2だったら標準偏差2つ分算術平均から下)


累積分布関数(CDF)

累積分布関数(CDF: Cumulative Distribution Function)は、ある値以下の確率を求めるための関数です。正規分布において、あるZスコア以下の確率を調べるときに使われる。

具体的に「CDF(Z=2)」とは、「Zスコアが2以下の確率」を指します。つまり、Zスコアが2というのは、標準正規分布で平均から2標準偏差だけ上にある点を意味し、その点までの累積確率がどれだけかを示すもの。

累積分布関数の公式

正規分布累積分布関数の公式

この積分は、標準正規分布算術平均が0、標準偏差が1)の確率密度関数(PDF: Probability Density Function)を積分したもの。累積分布関数の結果は、あるZスコア以下の範囲にデータが入る確率を示す。実際にこの積分を手計算するのは非常に難しいため、ほとんどの場合、統計ソフトウェアやテーブルを使って計算する。尚、CHATGPに聞いても求められる。(CHATGPTがPythonを使用して求める)


解く

課題1-1.直径が10.2mm以上の部品が不良品とされる。全体の中で何%の部品が不良品と考えられるか?
Zスコア = (10.2-10) / 0.1 = 2  (直径10.2mmは平均直径10mmから標準偏差2個分上という意味)
CDF(2)  =  約0.9772 (Zスコアが2(直径10.2mm)以下である確率が97.72%という意味)
つまり直径10.2mm以上の部品の確率は100% - 97.72% = 2.28% (答え)

課題1-2.直径が9.8mmから10.1mmの間に収まる部品の割合は何%か?
直径9.8mmのZスコア = (9.8-10) / 0.1 = -2
                      CDF(-2) = 約0.0228
直径10.1mmのZスコア = (10.1-10) / 0.1 = 1
                      CDF(1) = 約0.8413
84.13% - 2.28% = 81.85%  (答え)


、、、ふう、、、すんげえ時間かかったぞwwww

この記事が気に入ったらサポートをしてみませんか?