ゆる~いデータ分析「ものさし編」
~ そのデータは正しいのか? ~
さて、データ分析を説明していきたいと思います。と言っても、データ分析を行う前に確認する事があります。扱うデータの信頼性です。データが正しくないと、データ分析の意味がなくなります。
と言うことから最初は、ものさし等の「計測」の注意点などを見ていきたいと思います。
■定規で長さを測ってみましょう。
「ものさしを使っての測り方って知っていますか?」と問われると、一瞬悩みませんか?。という事でちょっと事例をひとつ見てみましょう。
ものさしをイメージした図で説明します。最小のメモリは1mm単位で刻んでいます。
ケースAでは10mm(1cm)の測定物を測ったとします。左側の基準が多少ずれても同じ長さになりそうです。
ケーズBでは9.5mm(0.95cm)では左側の基準がずれると、9.5mmなのか9.6mmなのか悩みそうですね。
左側の基準を合わせるという規定があれば、ほとんどの人が同じ数値を言いそうですが、基準がないとばらばらになりそうです。規定や人による誤差が無いという前条件があれば測定したデータを信じてもよさそうですが、規定がないと小数点の数値を信じてよいか悩みますね。
じゃ、ノギスとかマイクロゲージとかで測定しろよってツッコミは勘弁してくださいね。あくまで、イメージしやすくしたものです。
ものさしの信頼性については別途取り上げますが、測定しているデータが信頼してよいものか、確認が必要となります。また、どこまでの細かな数値を必要とするのかも、使うデータから考える必要があります。
■測定物は変化してないですか?
上段ではものさしの話をしました。今度は測定物の話です。例えば金属物の長さを測定するとしましょう。金属は温度で大きさが変わります。少々の大きさのズレは関係ないのであれば問題ありません。
細かな精度が必要な場合、マイナス温度と100℃以上の高温では測定する物の大きさは同じでしょうか?何らかの加工を加えた直後だと、温度があがって測定物の大きさは変わってませんか?
そうすると、室温(○○℃)でX時間放置後、室温で測定しないと正確でなかったり、前回と大きさが異なったりします。測定物の変化にも気をくばる必要がでてきます。
例えば重さも、北海道と沖縄では緯度による差を考慮する必要はありませんか?体重計でも緯度の補正する機能を持っているものもあるようですが、測定するものにも気を配りましょう。
■ものさしによって差がでてないですか?
なかなか、データ分析の世界にはいれないですが(笑)、元データに不備があると、全ての根底が崩れますので、もう少し、ものさしの話をします。
ここからは「ものさし」を「ゲージ(gage)」と言い換えていきます。
少したとえ話をしましょう。とある製品を作る工場では北海道と九州で同じ部品を作り、関東の工場で組み立てを行っていたとします。北海道の工場も九州の工場も同じ条件(気温、加工装置等)で製造し、同じ機種の装置で加工物の測定を行い、関東の工場に送っていたとします。
関東の工場で組み立てを行う際に、北海道の工場と九州の工場の部品は差があるようでした。北海道で製造した部品を九州の工場や関東の組み立て工場で測定すると微妙に差がありました。
同じ機種の装置でも個体差で、測定結果が異なる場合があります。加工精度が厳しくなると、ゲージの差が組み立てを行う製品の精度にあうのか評価する必要がでてきます。
組み立て側の精度要求が低ければ問題になりませんが、加工精度要求が高いと北海道と九州のゲージ差を補正して、加工側の精度も変える必要が出てきます。
製品の要求制度が上がるほど、ゲージの単体精度と相対精度の差を埋める必要がでてきます。つまりゲージが相対的にもあっているのか、ゲージの信頼性確認する必要がでできます。
☆測定ゲージ相対差は製品を作る上での許容範囲に入っているか?考える必要があります。この辺をGage R&Rと手法で確認することができます。
うまい事説明しているサイトがありましたので、下記をご参照ください。
https://econoshift.com/ja/gage-rr-template/
■使っている単位は同じですか??
2020年から世界的に流行っている病の「陽性率」という言葉について、ちょっと考えてみましょう。
●2020年4月位
陽性率=陽性者数/医者が検査を必要と認めた人の総検査数
●2021年1月位
陽性率=陽性者数/検査を希望した人の総検査数
●東京都の陽性率の定義
同じ陽性率でも時期や、場所によって内容が異なります。単位の中身が同じデータである事を確認しておいたほうが良いですね。何らかのデータを扱うさいは、同じ単位でも内容が同じなのか?気をつけておいたほうがよいでしょう。
https://econoshift.com/ja/gage-rr-template/
■纏め:データ分析の前に
重さでいれば、お菓子などを作る際の重量計が1g単位だと測りにくくないですか?せめて小数点1桁(0.1g)の単位までほしくなりますね。扱うデータの種類や分析内容によって、小数点以下の単位がどこまで必要になるかも注意しましょう。
話がそれましたが、データを分析する前に、分析を行うデータがあっているのか、測定システム(測定器や測定方法や規定など)が機能しているのか?など、データそのものの信頼性を調べる必要があります。
扱うデータの担保を調べて、分析にはいりましょう。