Python2年生:5日目
csvファイルを読み込むとこまではいったので、今日はデータの最初の列をインデックスとして使いたいとかそういうときのやつ。
次は、1行目に列名がないときのcsvを読み込む。
csvファイルを読み込むときのポイントは3つ
shift-jisが使われていたらエンコーディングがいる
0行目をインデックスにしたいときはindex_col=0
ヘッダーがないときはheader=None
次のレッスンはデータをざっくりと眺める()
具体的には??
データが正しく読み込めているか確認する(表示されたからといって正いとも限らないだろうしなぁ)
先頭の5行だけ確認。列名を確認。インデックス名を確認…ができる入力プログラムがあるので入力していく。
どれどれ。
できたできた。便利だなぁ。
それで?次は、データのどこを使うのか だ。
だんだんデータ分析らしくなってきたなぁ。
データのどこを使うのか
ついつい「ここは不要な気がするけど、後から使うかもしれないし」と非表示にして取っておいてしまう方なんだけど…。
必要なデータだけを取り出してまとめる
不要なデータを削除する
ってデータの量が多くなるほどに大事よね(反省)
さて、今日はここまで。
他にもやりたいことがあるし。
この記事が気に入ったらサポートをしてみませんか?