【Python】pandasデータクレンジング超基礎_その2
若手社員が、知識ゼロ状態からなんとなくpandasを使えるようになるまで勉強したことをまとめた記事その2です。簡単なサンプルデータを使用して、Pythonによるクレンジング手順例を解説します。
※ 記事その1はこちらからご覧ください:
本稿で紹介する処理例は、私が実務でよく使用したクレンジング処理を一つのシンプルな例に詰め込んだものです。記事その1ではご紹介しきれなかった処理を中心に、コードとその実行結果を一つずつ確認していきます。
私は、記事その1・その2でまとめた内容の知識のみで、数百行×数百列程度の、綺麗じゃないクロス集計表や星取表をクレンジングしておりました。この経験から「シンプルな知識の組合せのみで十分遂行可能な実務もある」と知りましたので、覚書も兼ね、その内容を本稿にまとめます。
サンプルとして使用するテーブル
▼ こちらが、クレンジング前のテーブルです(.xlsx)
▼ こちらが、クレンジング後のテーブルです(.csv)
クレンジング処理としては、所属チームの表記揺れ修正や、退職したメンバーの除外等を行いました。それでは、Pythonコードと、各処理の途中経過でテーブルがどのように変化するか確認していきましょう。
ここから先は
4,605字
/
15画像
¥ 400
最近髪をばっさり切りました。