少し専門的な誤差の話1


誤差にも色々あります。

・測定で生じる「測定誤差」
・デジタル変換に伴う「量子化誤差」
・計算に生じる「計算誤差」
・標本調査時に生じる「統計誤差」
・データ選択時に生じる「選択誤差(バイアス)」
・主観で生じる「認識誤差(バイアス)」

本稿では測定誤差について解説します。


誤差とは

誤差とは、実際に得られた値が本来の値からどれだけずれているかを表す量です。

長さ、時間、温度などどんな物理量でも様々な要因から測定に不確かさが含まれ、真の値に一致しません。



公差とは

誤差と公差は別物です。
公差とは誤差を許容できる範囲のことです。
工業製品では、設計を行うときに製作時の誤差を考慮して「まち」や「あそび」を設け、誤差を吸収できるようにしています。

設計者は常に許容可能な誤差範囲を設計に織り込んでおり、この誤差範囲を公差といいます。


絶対誤差と相対誤差

絶対誤差では誤差量を絶対値で求めます。
絶対誤差には単位がつきます。
 絶対誤差= 測定値-真値


一方、相対誤差は誤差の量と真値の比率です。絶対誤差を真値で除して求めます。なお誤差の単位はなく、あるいは%などの百分率で表します。
 相対誤差=(測定値-真値)/真値



次に両者の違いですが、扱う数字のスケールが似ている場合は、絶対誤差の方が直感的に理解・比較できます。

例) 100gで生産したお菓子Aが104g、お菓子Bが110gだった場合の誤差の比較



一方、相対誤差では、スケールの異なる物理量の不確かさを比較することができます。

例) 100gのお菓子Aに異物15g混入していた場合と、250mlのジュースBに異物35ml混入していた場合の異物の割合を比較

絶対誤差と相対誤差の使い方が不適切であると誤った認識を起こしてしまいます。





測定誤差

測定誤差は3つに分けられます。
 1.系統誤差
 2.偶然誤差
 3.過失誤差

1.系統誤差

特定の原因によって測定値が偏る誤差です。次の3つがあります。

・機器誤差
測定器の個体差や校正不足による機器誤差です。定規やマイクロメーターや温度計などの正確さは機器ごとにばらつきがあります。


・理論誤差
直接測定した値だけが実験値ではありません。直接は測れずとも、既測値を組み合わせることで理論的に得られる実験値もあります。その際の理論に少し不正確があると誤差が生じます。


・個人誤差
人による目盛り読み取りのバラツキ、各人の測定方法の癖に起因した誤差です。



2.偶然誤差

偶発的な原因によって測定結果に導入される誤差で、繰り返し測定を行えば毎回異なる値の誤差を生じます。

系統誤差とは異なり、後から理論的に補正することはできません。ただし測定を何度も繰り返し、特定の分布を得ることができれば、その測定方法に即した最適な方法によって精度を上げることができます。
(例えば、平均値や最頻値を採用するなど)



3.過失誤差

測定者の経験不足や誤操作による誤差です。

実験者の勘違いや機器の操作ミス、目盛りの読み間違い、記録間違い、確認不足があります。あってはならない誤差ですが、こういうことが起こり得ることを無視してはいけません。




系統誤差と偶然誤差の特徴

系統誤差は真値から一定方向にずれる傾向、
偶然誤差は真値の周りにばらつく傾向があります。

系統誤差が少ないことを「正確さが高い」
偶然誤差が少ないことを「精密さが高い」
と表現します。なお「精度」という言葉はどちらにも使われます。

偶然誤差が小さいのは、それだけ揺らぎの要因を抑えた実験ができているということです。
偶然誤差は測定回数を増やし、統計処理を行うことで、真値に近い値を得ることが出来ます。




測定対象がバラツキをもつ場合

これまではある1つの対象物に対する誤差について説明しました。しかし実際は、測定対象とする事象自体がある分布(バラツキ)を持っている場合もあります。

例えば、工場で生産する製品が規定の寸法に対し、一定の範囲内に収まっているか測定する場合です。

この場合、測定対象が持つばらつきと、測定方法自体がもつ誤差を区別しなければなりません。

例えば、ある部品の寸法精度が±1%の範囲内か検定したいときに、測定方法自体が±1%の誤差を含んでいると測定自体が無意味となります。




対策1.平均値

ばらつきを持つ値は平均値でよく対処します。

例えば日本人の身長の平均です。この場合、全員は測定せず、一部の母集団からランダムに選んだ標本を用いて測定します。

この場合、平均値の精度は調べた人数等によりますが、その他に測定自体の精度も勘案しなければいけません。



対策2.試行回数の増加

系統誤差が無視できる測定方法だったとすると、偶然誤差については、一つの測定対象を繰り返し測定することで十分に小さくすることが出来ます。

このように測定回数を上げることによって偶然誤差を小さくすることが出来ますが、母集団が小さいなど、測定対象側に問題があると意味がありません。




フィッシャーの3原則

データを集める際には、上記の誤差を考慮する必要があります。

データ分析も重要ですが、その前提となるデータの集め方も分析結果を大きく左右しますこのとき便利なのが。「フィッシャーの3原則」です。データ収集の指針が示されています。

・反復(replication)
・無作為化(randomization)
・局所管理(local control)

「反復」とは複数回測定を行うことです。1度だけでは、測定値に違いが出たとしても意味のある違いか偶然の違いか、単なるミスか判断できません。反復測定を行うことで、偶然誤差を評価できます。


「無作為化と」は、比較したい条件を無作為に割り振ることです。実験の順序、時間、場所などが測定結果に影響を与え「ある一定の傾向がある誤差(系統誤差)」が生じる可能性があります。系統誤差が生じるときに無作為化を行うことで、系統誤差の影響を小さくすることができます。



「局所管理」とは、測定条件が極力均一になるようにすることです。測定では実験の順序、時間、場所などが測定結果に影響を与え、系統誤差が生じる可能性があります。そのような時、実験を行う時間や場所を同じにした条件を作ります。局地管理を行うことができれば、「無作為化」以上に、系統誤差を小さくすることができます。










いいなと思ったら応援しよう!

この記事が参加している募集