数のヨミカキ日記 #9 2022年3月10日(木)
~チェックの重要性を感じてます!~
【本日のデータ関連業務】
通販会社D社のデータ整理作業 その2
概要:決定した作業プロセスの実行
データの中間処理・加工
#8記載の2)の作業
利用ツール:エクセル
所要時間:1時間程度
【作業概要】
●フォーマット作成
・エクセルシートにデータをコピペしていくと集計用の元データができるようなフォーマットを作成
・四則演算を駆使(?)し、セルに計算式を埋め込む作業
・フォーマットには、作業ミスやデータエラーを発見する行や列を組み込む
●データのクレンジング、チェック作業
・コピペなどの手作業が多いので、入念にチェック
少なくとも数分間に1回は、何らかのチェック・確認作業をする
【作業についての所感など】
統計書などで「Garbag in, garbage out」という言葉を目にすることがある。これは「ゴミを入れればゴミが出てくる」という意味。とても素晴らしい言葉である。集計用データの精査工程を「クレンジング」と呼ぶことと整合的である。私自身は「データにゴミが混じると、結果が全てゴミになる」と理解し、戒めの言葉としている。
今日はチェック作業に多くの時間を費やした。ゴミを混ぜないためには避けて通れないもの。私のチェック作業にかける時間は、データ作成(事前処理)全体の3~5割程度、またはそれ以上であると思う。
様々な工夫で、チェックの時間を短縮することも重要であるが、最終的には細かい作業の積み重ねになる。チェック工程で手を抜き、集計した後でゴミの混入(ミスの発覚)に気づくと、データ処理と集計のやり直しになる。結局、チェックを入念に行い、正確な集計用データを作成するのが最も効率がいい。長年データ処理作業をしてきて学んだことである。
【つぶやき】
今週はバタバタしたので、少し疲れ気味。週末はゆっくりしたい。
※2022年3月15日、データのクレンジングについて、加筆修正しました。