見出し画像

【初GitHub投稿】Pythonでcsvファイル→DB→ボックスプロット表示

はじめてGitHubに投稿しました。

職業訓練でPythonを学習しています。

前職の業務を効率化できると思いコードを書きました。

せっかくなのでGitHubに投稿しました。

コードは下のGitHubにあります。

出力イメージ

項目ごとにボックスプロットを表示 左右には日別のデータが並ぶ

目的

  • 前職の業務を想定した、業務効率向上化

  • 職業訓練で学んだことを一連の流れで行うこと

背景

 前職の業務で、量産品の寸法データの傾向を顧客から依頼される機会が多くあった。そのたびにExcelファイルをかき集め、データを何度もコピー&ペーストして、ボックスプロットを表示するExcelシートを作り上げいた。
 また、社内的にもデータの傾向を可視化できるのは歓迎される。(手間がかからなければ)
 具体的には、顧客は穴径が大きめなのか小さ目を知りたい。顧客はその穴に取り付ける部品があり、その部品とのはめ合いを考慮したいーなど。

(問題1)測定日ごとに別々のExcelファイルでデータを管理していた
⇒(解決1)測定日ごとにDB(データベース)で管理する

(問題2)何度もコピー&ペーストが必要で手間がかかっていた
⇒(解決2)Pythonで自動化。時短。

概要

  1. 複数のcsvファイルを読み込む

  2. DBに格納

  3. DBからデータを取得

  4. 項目毎にボックスプロットを生成

使用ソフト

Anaconda Navigator 2.3.1 (anaconda3)Visual Studio Code 1.65.0
Python 
EXCEL 2021
DB Browser for SQLite 3.32.2

python version

Python 3.8.13   
numpy 1.18.5
pandas 1.5.1
matplotlib 3.5.1
openpyxl 3.0.10

実行する際に

ファイルを実行する際はフォルダを作成し、以下ファイルを同じフォルダに入れて、実行してください

  • ipynbファイル1つ

  • 230201.csv~230210.csv(10ファイル)

  • test_data.db

実行データ

Boxplot_from_csv.ipynb

1.csvデータをDBに入れる

準備したデータ:10測定項目×32データ(30データの場合もあり) ×csvファイル10個
Pythonで複数のcsvファイルからデータを取得する。
日付と紐づけてDB(test_data.dbのテーブルtest_data)に格納する

2.DBからボックスプロットを表示

表示の開始日と期間を指定する
PythonでDBから指定範囲のデータを読み込み、項目ごとに日別のボックスプロット並べて表示

所感

プログラミング初学者として、
csv→DB→可視化の一連の流れを復習する意味でも本コードを書きました。
いい復習になったかと思います。

いいなと思ったら応援しよう!