分析化学の話(7) - 近似?誤差(不確かさ)の伝播則
誤差(不確かさ)の伝播則は近似にもとづいています。分析化学と直接関係ないので、興味のない方は無視してください。
1.復習: 誤差(不確かさ)の伝播則
測定値$${x}$$と$${y}$$があります。測定値はばらつくから、確率変数$${X}$$と$${Y}$$とみなされます。ただし、$${X}$$と$${Y}$$は独立で相関がないものとします。
$${X}$$と$${Y}$$とを組み合わせた分析結果を$${Z}$$とします。$${Z}$$もばらつくから、一種の確率変数となります。$${Z}$$は、$${X}$$と$${Y}$$の関数であるとします:
$$
Z = F(X, Y) \quad \quad \quad \quad \quad \quad (1)
$$
たとえば、試料の質量(重さ)$${X}$$と溶液の体積$${Y}$$を測定データ、分析結果の質量濃度を$${Z}$$とすると、$${Z=F(X,Y)=X/Y}$$となります。
$${z}$$の標準不確かさ$${u(z)}$$は次の式で与えられます:
$$
u^2(z)= \bigg (\dfrac{\partial F}{\partial x} \bigg )_{\mu_1, \mu_2}^2 u^2(x) + \bigg (\dfrac{\partial F}{\partial y} \bigg )_{\mu_1, \mu_2}^2 u^2(y) \quad \quad \quad \quad (2)
$$
ここで、偏微分係数$${(\partial F/\partial x)_{\mu_1, \mu_2}}$$と$${(\partial F/\partial y)_{\mu_1, \mu_2}}$$の値は、平均値$${x=\mu_1, y=\mu_2}$$での値です。$${u(x)}$$と$${u(y)}$$が分かっていると、式(2)から$${u(z)}$$がわかります。式(2)を、誤差の伝播則、あるいは不確かさの伝播則とよびます[1,2]。
2.疑問
確率変数$${Z}$$が、互いに独立な確率変数$${X}$$と$${Y}$$の関数になっているとします:
$$
Z = F(X, Y)
$$
式(2)と同様に、母集団に対して誤差(不確かさ)の伝播則
$$
\sigma^2= \bigg (\dfrac{\partial F}{\partial x} \bigg )_{\mu_1, \mu_2}^2 \sigma_1^2 + \bigg (\dfrac{\partial F}{\partial y} \bigg )_{\mu_1, \mu_2}^2 \sigma_2^2 \quad \quad \quad \quad (3)
$$
が果たして、常に成り立つでしょうか?実は、式(3)が誤差(不確かさ)の伝播則の背景になっていると思われます。
3.近似としての誤差(不確かさ)の伝播則
3.1 導出
関数$${z=F(x,y)}$$を平均値(期待値)$${x=\mu_1}$$と$${y=\mu_2}$$の周りでTaylor展開します。ただし、確率変数$${X}$$と$${Y}$$は独立とします。
$$
F(x, y) = F(\mu_1, \mu_2) + \bigg( \dfrac{\partial F}{\partial x} \bigg)_{\mu_1, \mu_2}(x-\mu_1) + \bigg( \dfrac{\partial F}{\partial y} \bigg)_{\mu_1, \mu_2}(y-\mu_2) +\\ + O((x-\mu_1)^2, (y-\mu_2)^2)
$$
$${O}$$はランダウの記号で、高次項を指しています。高次項を無視して、1次項($${(x-\mu_1)}$$と$${(y-\mu_2)}$$)のみ考慮すると、近似式として、
$$
F(x, y) \simeq F(\mu_1, \mu_2) + \bigg( \dfrac{\partial F}{\partial x} \bigg)_{\mu_1, \mu_2}(x-\mu_1) + \bigg( \dfrac{\partial F}{\partial y} \bigg)_{\mu_1, \mu_2}(y-\mu_2)\quad (4)
$$
確率変数$${X}$$と$${Y}$$の確率密度関数を、それぞれ$${f(x)}$$と$${g(y)}$$とします。確率変数$${Z}$$の母平均値を$${\mu}$$、母標準偏差を$${\sigma}$$とします。そうすると[3]、
$$
\mu = \displaystyle \int_{-\infty}^\infty \int_{-\infty}^\infty F(x,y)f(x)g(y)\mathrm{d}x\mathrm{d}y
\simeq \int_{-\infty}^\infty \int_{-\infty}^\infty \Big[ F(\mu_1, \mu_2) +
\\
\bigg( \dfrac{\partial F}{\partial x} \bigg)_{\mu_1, \mu_2}(x-\mu_1) +\bigg( \dfrac{\partial F}{\partial y} \bigg)_{\mu_1, \mu_2}(y-\mu_2)\Big]f(x)g(y)\mathrm{d}x\mathrm{d}y =\\ = F(\mu_1, \mu_2) \quad \quad \quad \quad \quad (5)
$$
標準偏差$${\sigma}$$は、式(4)を代入して、
$$
\sigma^2 = \displaystyle \int_{-\infty}^\infty \int_{-\infty}^\infty(F(x,y)-\mu)^2 f(x)g(y)\mathrm{d}x\mathrm{d}y
\\
\simeq \int_{-\infty}^\infty \int_{-\infty}^\infty\bigg[ \bigg( \dfrac{\partial F}{\partial x} \bigg)_{\mu_1, \mu_2}(x-\mu_1) + \bigg( \dfrac{\partial F}{\partial y} \bigg)_{\mu_1, \mu_2}(y-\mu_2) \bigg]^2 f(x)g(y)\mathrm{d}x\mathrm{d}y
\\
= \int_{-\infty}^\infty \int_{-\infty}^\infty \bigg[ \bigg( \dfrac{\partial F}{\partial x} \bigg)_{\mu_1, \mu_2}^2(x-\mu_1)^2 +2\bigg( \dfrac{\partial F}{\partial x} \bigg)_{\mu_1, \mu_2} \bigg( \dfrac{\partial F}{\partial y} \bigg)_{\mu_1, \mu_2}(x-\mu_1)(y-\mu_2) +
\\
+ \bigg( \dfrac{\partial F}{\partial y} \bigg)_{\mu_1, \mu_2}^2(y-\mu_2)^2 \bigg]^2 f(x)g(y) \mathrm{d}x \mathrm{d}y
$$
よって[3]、
$$
\sigma^2 = \bigg( \dfrac{\partial F}{\partial x} \bigg)_{\mu_1, \mu_2}^2\displaystyle \int_{-\infty}^\infty (x-\mu_1)^2 f(x)\mathrm{d}x +\bigg( \dfrac{\partial F}{\partial y} \bigg)_{\mu_1, \mu_2}^2\displaystyle \int_{-\infty}^\infty (y-\mu_2)^2 g(y)\mathrm{d}y
\\
= \bigg( \dfrac{\partial F}{\partial x} \bigg)_{\mu_1, \mu_2}^2 \sigma_1^2 +\bigg( \dfrac{\partial F}{\partial y} \bigg)_{\mu_1, \mu_2}^2 \sigma_2^2 \quad \quad \quad \quad \quad \quad(6)
$$
が得られます。式(3)が成立します。しかし、
という疑問が残るのではないでしょうか。そこで、以下では厳密な式を考えていきます。
3.厳密な式
3.1 一般式
$${F(x,y)}$$を近似しない場合、確率変数$${Z}$$の確率密度関数$${q(z)}$$は次式で与えられます(ここでも確率変数$${X}$$と$${Y}$$は互いに独立であるとします)[4, 5]:
$${\delta (x)}$$:デルタ関数
ちなみに、$${q(z)}$$は確率密度関数の性質を満たしています:
$$
\displaystyle \int_{-\infty}^\infty q(z) \mathrm{d}z = \int_{-\infty}^\infty \int_{-\infty}^\infty \Big [ \int_{-\infty}^\infty\delta (z-F(x, y)) \mathrm{d}z \Big ]f(x)g(y) \mathrm{d}x \mathrm{d}y = \\ = \int_{-\infty}^\infty \int_{-\infty}^\infty f(x)g(y) \mathrm{d}x \mathrm{d}y = \int_{-\infty}^\infty f(x)\mathrm{d}x \int_{-\infty}^\infty g(y)\mathrm{d}y = 1 \times 1 = 1
$$
ここで、$${\delta}$$関数の性質、
$$
\displaystyle \int_{-\infty}^\infty \delta (z-a) \mathrm{d}z = 1
$$
を使いました。
たとえば、$${Z = X + Y}$$だと式(7)は、
$$
q(z) = \displaystyle \int_{-\infty}^\infty \int_{-\infty}^\infty\delta (z-x-y))f(x)g(y) \mathrm{d}x \mathrm{d}y
$$
となります。あとは、たとえば、$${X}$$が正規分布に従うなら、
$$
f(x) = \dfrac{1}{\sqrt{2\pi} \sigma_1} \exp \bigg [ - \dfrac{(x-\mu_1)^2}{2\sigma_1^2} \bigg ]
$$
などを式(7)に代入して計算します。
3.2 これから検討すること
式(7)をよりどころとして、式(3)や式(6)がどのていど厳密に成立しているかどうか、化学分析の現場でよく出てくる次の各場合について次回以降の記事で考えたいと思います:
$$
\begin{array}{ll}
\mathrm{\small a)} & \boldsymbol{和} Z = X+Y\\
\mathrm{\small b)} & \boldsymbol{積} Z = XY\\
\mathrm{\small c)} & \boldsymbol{商} Z = X/Y\\
\end{array}
$$
もしも式(3)や(6)が正しいという結果が得られたなら、誤差(不確かさ)の伝播則を安心して使えるんじゃないでしょうか。
文献とNote
[1] 少なくとも私は、式(2)や式(3)が厳密な式だと思って、知ったかぶりをしてきました。
[2] 田中秀幸、高津章子、"分析・測定データの統計処理"、朝倉書店、2014. 誤差の伝播則が近似であることを明記されています(p.45)。
[3]
$$
\displaystyle \int_{-\infty}^\infty \int_{-\infty}^\infty(x-\mu_1) f(x)g(y)\mathrm{d}x\mathrm{d}y = \int_{-\infty}^\infty (x-\mu_1) f(x) \mathrm{d}x \int_{-\infty}^\infty g(y) \mathrm{d}y
\\
= \Big( \int_{-\infty}^\infty x f(x) \mathrm{d}x - \mu_1 \Big) \times 1= \mu_1 - \mu_1 =0 \quad \quad \quad \quad (\mathrm{A}1)
$$
$${y}$$についても同様です。なお、もともとの性質、
$$
\displaystyle \int_{-\infty}^\infty f(x) \mathrm{d}x =\displaystyle \int_{-\infty}^\infty g(y) \mathrm{d}y = 1
$$
を使いました。
[4] 緑川章一、"確率変数の和,積,商,べき乗の分布".
[5] 早川美徳、"Pythonプログラミング(ステップ7・確率密度関数とその計算)" Feb. 15, 2022.
【免責事項】本記事は単なるメモとして書かれたもので、その正確性を必ずしも保証するものではありません。本記事によって生じたトラブル、損失、又は損害に対して一切責任を負いません。また、著者が所属する組織とは関係ありません。誤りがあればご指摘ください。クレームはご遠慮ください。