#6 Python/Pandas データ基礎

データを取り扱うにあたって非常に便利な外部ライブラリにpandasがあります。データを取り扱うにあたって非常に便利です。

pandasは、1次元、2次元、3次元のデータ構造を扱うことができます。

まずは、1次元データを格納する方法をやっていきます。

import pandas as pd
sr = pd.Series(['A','B','C'])
sr

画像1

import pandas as pdでpandasのライブラリーをpdという形で使えるようにしてインポートしています。今後出てくるpdはpandasのことです。

2行目でシリーズ型(1次元)を呼び出して['A','B','C']と入力して、1次元データ構造を作ります。それらをsr(任意)に格納しておきます。

結果、srには1次元データが作成されました。

同様に、2次元の場合、

df = pd.DataFrame([['A','B','C'],['D','E','F']])
df

画像2

このように2次元データが作成されます。つぎに今作成したデータをcsv形式に変換してcsvファイルでディレクトリに保存します。

df.to_csv('ABCDEF.csv')

画像3

ディレクトリ内にABCDEF.csvが作成されていることが分かります。この情報量の少ないcsvだとつまらないので、sample_dataに保存されているcsvを読み込んでみます。

pd.read_csv('sample_data/california_housing_train.csv')

画像4

これでディレクトリ内にあるcsvデータを読み込むことができました。

いいなと思ったら応援しよう!