見出し画像

分析化学の話(5) - 誤差(不確かさ)の伝播

誤差(不確かさ)の伝播のイメージを見てみます。


1.足し算(z=x+y)の場合

二つの測定データ$${x}$$と$${y}$$があるとします。これら二つの足し算を測定値$${z}$$($${z}$$は直接測定しません)とします[1]:

$$
z = x + y \quad  \quad \quad \quad (1)
$$

測定データである$${x}$$ と$${y}$$はばらつくので、測定値$${z}$$もばらつきます。
 そこで問題です。$${x}$$ と$${y}$$のばらつきの程度を表す標準偏差[2] $${s_x}$$と$${s_y}$$がわかっているとき、$${z}$$の標準偏差$${s_z}$$を推定できるでしょうか?
 図1の$${x}$$と$${y}$$は、正規分布に従うランダムなデータです。$${z=x+y}$$です。$${s_z = s_x + s_y = 0.1 + 0.1 = 0.2}$$ではないような気がします。

図1 正規分布従うxとyのデータとz=x+yのシミュレーションのデータ。xとyのランダムなデータは、Pythonのモジュールnumpy のPCG64で発生させました。zのデータは、xとyのランダムなデータの和をとりました。xの平均と標準偏差はそれぞれ1と0.1、yの平均と標準偏差はそれぞれ2と0.1に設定しました。色のついた半透明の領域が、「平均±標準偏差」の領域です。zの標準偏差は、0.142でした。

正解は、

$$
s_z = \sqrt{s_x^2 + s_y^2} = \sqrt{0.1^2 + 0.1^2} = 0.141 …
$$

でも、なぜこうなるんでしょうか?

2.掛け算(z=xy)の場合

今度は掛け算の場合を考えてみます[3]。式で表すと、

$$
z = xy \quad  \quad \quad \quad (2)
$$

図2を見ると、$${s_z = s_x + s_y = 0.2+0.4=0.6}$$でも、$${s_z = s_x \times s_y = 0.2 \times 0.4 = 0.08}$$でもなさそうです。

図2 正規分布従うxとyのデータとz=xyのシミュレーションのデータ。xとyのランダムなデータは、Pythonのモジュールnumpy のPCG64で発生させました。zのデータは、xとyのランダムなデータの積をとりました。xの平均と標準偏差はそれぞれ2と0.2、yの平均と標準偏差はそれぞれ4と0.4に設定しました。色のついた半透明の領域が、「平均±標準偏差」の領域です。zの標準偏差は、1.11でした。

正解は、

$$
s_z = \bar{z} \sqrt{\Big (\dfrac{s_x}{\bar{x}} \Big )^2 + \Big (\dfrac{s_y}{\bar{y}} \Big )^2} = 8 \times \sqrt{\Big (\dfrac{0.2}{2} \Big)^2 + \Big (\dfrac{0.4}{4} \Big )^2} = 8\sqrt{2} \times 0.1 = 1.13
$$

です。なぜこうなるんでしょうか?

文献とNote

[1] 例えば、溶液の質量(z) = 試料の質量(x) + 溶媒の質量(y)。他に何かいい例があれば教えてください。
[2] 平均と標準偏差
N個のデータがあるとする:

$$
x_1, x_2, x_3, \cdots, x_N
$$

$$
平均(\bar{x}) = \dfrac{x_1 + x_2 + \cdots + x_N}{N} = \dfrac{\displaystyle \sum_{i=1}^N x_i}{N}
$$

$$
標準偏差(s) = \sqrt { \dfrac{(x_1 - \bar{x})^2 + (x_2 - \bar{x})^2 + \cdots +(x_N - \bar{x})^2}{N-1}}
$$

[3] 例えば、試料の量(z) = 溶液の濃度(x) × 溶液の体積(y)。他に何かいい例があれば教えてください。




【免責事項】本記事は単なるメモとして書かれたもので、その正確性を必ずしも保証するものではありません。本記事によって生じたトラブル、損失、又は損害に対して一切責任を負いません。また、著者が所属する組織とは関係ありません。誤りがあればご指摘ください。クレームはご遠慮ください。



いいなと思ったら応援しよう!