数のヨミカキ日記 #12 2022年4月8日(金)
~ファイルの保存ミスをやらかして感じたこと~
【本日のデータ関連業務】
E社の3月分の入電数レポート作成。とりまとめ形式は、他社と共通。
※会社ごとに多少のアレンジはある
概要:フリーダイヤルのトラフィックデータのとりまとめ、入電数を曜日別時間帯別に集計
利用ツール:エクセル
所要時間:3時間前後
【作業概要】
●データのチェック
E社から送付されてくるフリーダイヤルのデータのチェック
同社はフリーダイヤルを14本使用している
時間ごとのデータなので、ファイル数やデータの過不足のチェックは必須
エクセルのシートでは744行のデータ(24H×31日)が14セット
●2つのカテゴリーにまとめる
14本のフリーダイヤルは、既存顧客用に2本、新規顧客用に12本使用しているため、既存と新規の2つにまとめる
2つのキャリア(電話会社)を使用しているので、微妙に異なったデータを処理するため少々(かなり?)面倒
具体的には以下のような作業の流れ
①集計データの作成
SB社の時間別データを加工
Ncom社と同じ形式にする
②既存と新規の合計作成
何度か改良を重ね作成した合計算出用のエクセルシートを利用する
各フリーダイヤルの時間別データをコピペしていくと合計が自動的に計算される
14回のコピペ作業はミスが起こりやすいので丁寧に処理
●定型フォーマットでのデータ集計
既存合計と新規合計の2つをデータを専用のエクセルシートに取り込む(コピペする)
曜日やflgの調整と確認
※#8から#10で紹介したフォーマットと同じもの
データの再計算処理(更新)を行うと処理が完了
※印刷レイアウトまで整った9種類の表が完成
●確認作業、提出用データ作成
前月までのデータとの比較
異常値がないか確認 など
最後にPDFファイルに変換
【作業についての所感など】
上記の『定型フォーマットでのデータ集計』は、まず、前月の集計結果ファイルを別名で保存し、当月用のファイルとして使用する。
しかし、今回はこの処理を忘れ、2月のファイルに3月のデータを取り込み、誤ってそのまま上書き保存してしまった。すなわち、2月の集計結果のファイルを消失してしまった。一瞬、焦ったが、ストレージサービス(Dropbox)のファイル復元機能で、無事ファイルを復元した。
集計結果とその計算履歴の保管は、データの集計や分析を行う者としての義務と考えている。データ集計・分析は「再現性」が求められ、その過程をブラックボックス化してはならない。
クライアントや関係者から分析方法の説明を求められた時、分かりやすく解説する必要がある。結果だけでなく集計の履歴を残しておくと、役に立つことが多い。
また、データに疑義が生じた時の検証作業や、ミスが発見された時の原因究明にも役立つ。
計算過程のファイルも可能な限り細かく保存するようにしている。ファイル数が増えるので、保管場所(フォルダ)やファイル名称は、ルールを自分で設定し、そのルールを守るように心がけている。
ルールの一例を紹介しておく。
ファイル名は作成した日付を先頭に、その後アンダーバーをつけて内容が分かるようにしている。例えば「220408_時間別トラフィック_3月既存」などである。
ファイル名を短くするため、なるべくプロジェクトやクライアントの名称はを入れないようにしている。その代わり、フォルダーでの仕訳(分類)をきちんと行っている。名称を入れる場合は、アルファベット2~4文字の略称を使う。略称は関係者間(クライアント)で共通ルールとして設定することも多い。
Dropboxのおかげで無駄な復元作業をせずにすみ、ほっとしている。
【つぶやき】
今朝、所用があり、近所の駅周辺まで車で出かけた。
学校も新学期が始まり、コロナ前とほぼ同じような人出で、かなり混んでいた。
活気が戻り喜ばしいことであるが、人の往来が激しくなり、車が渋滞気味でストレスを感じる。コロナのピーク時は、人通りが少なく、経済のダメージを嘆いていたことを思い出し、自分の身勝手さを反省した。
普段の生活に近づいていることに感謝しながら行動しようと思う。