Pythonを触ってみる1
客先から常駐バッチのログ解析を依頼されたのでPythonを使ってログ解析をしようと思います。
なぜPythonなのかは特に理由はなくいつもJavaばかり触ってるので別の言語を触ってみたかったから。
もらったログの以下のとおり
(ログ出力時間 プロセスID ログレベル ログ内容)
19:02:49.615 4fcd1c9d-75fe-4396-a7a0-0af32eb066c2 INFO BatchApp start
19:02:50.568 4fcd1c9d-75fe-4396-a7a0-0af32eb066c2 INFO data insert start
19:03:49.569 0cc41e62-d704-4685-92e2-fb49922d42ca INFO BatchApp start
19:03:51.131 4fcd1c9d-75fe-4396-a7a0-0af32eb066c2 INFO data insert end
19:03:51.146 4fcd1c9d-75fe-4396-a7a0-0af32eb066c2 INFO BatchApp end
19:03:56.710 0cc41e62-d704-4685-92e2-fb49922d42ca INFO data insert start
19:04:16.319 0cc41e62-d704-4685-92e2-fb49922d42ca INFO data insert end
19:04:19.944 0cc41e62-d704-4685-92e2-fb49922d42ca INFO data insert start
19:04:19.944 0cc41e62-d704-4685-92e2-fb49922d42ca INFO data insert end
19:04:54.914 0cc41e62-d704-4685-92e2-fb49922d42ca INFO BatchApp end
ログファイルは日付毎に出力されファイル名は下記のとおり
2021-08-27_batch.log
2021-08-28_batch.log
2021-08-29_batch.log
2021-08-30_batch.log
2021-08-31_batch.log
バッチ毎の処理時間が知りたいとのことなので各ファイルを読み込んでプロセスID毎に"BatchApp start"と"BatchApp end"の差を集計すれば目的のデータを作成できそうです。
ポイントになる機能は下記になるかと
ファイル入出力
ループ
分岐
文字列分割
次回は各機能をPythonではどのように実装するか調べます。