見出し画像

数のヨミカキ日記 #9 2022年3月10日(木)

 ~チェックの重要性を感じてます!~

【本日のデータ関連業務】

通販会社D社のデータ整理作業 その2
概要:決定した作業プロセスの実行
   データの中間処理・加工
   #8記載の2)の作業
利用ツール:エクセル
所要時間:1時間程度

【作業概要】

●フォーマット作成
・エクセルシートにデータをコピペしていくと集計用の元データができるようなフォーマットを作成
・四則演算を駆使(?)し、セルに計算式を埋め込む作業
・フォーマットには、作業ミスやデータエラーを発見する行や列を組み込む
●データのクレンジング、チェック作業
・コピペなどの手作業が多いので、入念にチェック
 少なくとも数分間に1回は、何らかのチェック・確認作業をする

【作業についての所感など】

 統計書などで「Garbag in, garbage out」という言葉を目にすることがある。これは「ゴミを入れればゴミが出てくる」という意味。とても素晴らしい言葉である。集計用データの精査工程を「クレンジング」と呼ぶことと整合的である。私自身は「データにゴミが混じると、結果が全てゴミになる」と理解し、戒めの言葉としている。

 今日はチェック作業に多くの時間を費やした。ゴミを混ぜないためには避けて通れないもの。私のチェック作業にかける時間は、データ作成(事前処理)全体の3~5割程度、またはそれ以上であると思う。

 様々な工夫で、チェックの時間を短縮することも重要であるが、最終的には細かい作業の積み重ねになる。チェック工程で手を抜き、集計した後でゴミの混入(ミスの発覚)に気づくと、データ処理と集計のやり直しになる。結局、チェックを入念に行い、正確な集計用データを作成するのが最も効率がいい。長年データ処理作業をしてきて学んだことである。

【つぶやき】

 今週はバタバタしたので、少し疲れ気味。週末はゆっくりしたい。

※2022年3月15日、データのクレンジングについて、加筆修正しました。

いいなと思ったら応援しよう!