#6 Python/Pandas データ基礎
データを取り扱うにあたって非常に便利な外部ライブラリにpandasがあります。データを取り扱うにあたって非常に便利です。
pandasは、1次元、2次元、3次元のデータ構造を扱うことができます。
まずは、1次元データを格納する方法をやっていきます。
import pandas as pd
sr = pd.Series(['A','B','C'])
sr
import pandas as pdでpandasのライブラリーをpdという形で使えるようにしてインポートしています。今後出てくるpdはpandasのことです。
2行目でシリーズ型(1次元)を呼び出して['A','B','C']と入力して、1次元データ構造を作ります。それらをsr(任意)に格納しておきます。
結果、srには1次元データが作成されました。
同様に、2次元の場合、
df = pd.DataFrame([['A','B','C'],['D','E','F']])
df
このように2次元データが作成されます。つぎに今作成したデータをcsv形式に変換してcsvファイルでディレクトリに保存します。
df.to_csv('ABCDEF.csv')
ディレクトリ内にABCDEF.csvが作成されていることが分かります。この情報量の少ないcsvだとつまらないので、sample_dataに保存されているcsvを読み込んでみます。
pd.read_csv('sample_data/california_housing_train.csv')
これでディレクトリ内にあるcsvデータを読み込むことができました。