QC検定2級のテキストに書いてあることを学びつつ・・・
昨日からQC検定2級のテキストを眺めつつ、仕事で過去に使って来たことを思い出している感じです。
データの取り方とまとめ方について学習したので、アウトプットの意味で簡単に紹介します。
1)ランダムサンプリング
仕事や何かのアンケート調査等において、全てのデータを取ることは基本的には不可能ですし非効率です。そんなとき、知りたいデータの集団(母集団という)・「ヒントとなるデータ」を取ります。
母集団からサンプリングして得たデータはランダムでなければならない。
2)数値データの種類
測定器で測って得られるデータを計量値データといい、例えば、重量(kg、gなど)、寸法(mm、cm、mなど)などが該当します。
数えて得られるデータを計数値データといい、例えば、不良数(件数)、トラブル数(件数)などが該当します。
数値データの他にも言語データもあります。会話や文章などから得られるデータで、数値データでは表しにくい事実をとらえるのに利用します。
3)データのまとめ方
数値データをまとめるとき、大きく2つに分類されます。
①数値的にまとめる:平均値、バラツキ、関係性を表す値(相関係数)
②視覚的にまとめる:ヒストグラム(分布の姿を見る)、散布図(2つの特製の関係を見る)
4)基本統計量
・平均値 データの総和をデータ数で割ったもの
・中央値 測定データの中心値
・バラツキ 測定データのバラツキの大きさを見る値
・データ範囲(レンジ) 測定データの最大値と最小値の差
バラツキの大きさを簡易的に計算するときに使われる
テキストで紹介されている内容を自分でNumbersで計算してみました。そちらも合わせて確認してみて下さい。
5)ヒストグラム
テキストを真似して久しぶりに、Excelの分析ツールを使用せずにヒストグラムを作成してみました。ヒストグラムを作成するとデータの傾向を視覚的に見ることが可能です。
その他にも正規分布、正規分布から確率(不良発生率)を求めるところもテキストの例題を通じて学習しました。
明日は検定・推定のところを重点的に学習しようと思います。