Python プログラミング学習記録③

データフレームの加工

#指定の列(columns)を削除
del_list=['削除したい列番号']
df.drop(df.columns[[del_list]],axis=1)

#指定の列の重複を削除したデータフレーム(keep='fist','last','False')
df_dubledel=df[~df.duplicated(subset=['指定の列名'],keep='last')

#指定の列の重複を削除したリスト
uni_list=df['指定の列名'].unique().tolist()

#指定の文字列がある行を削除
df[df['列名'].str.contains('指定の文字列')]

#non欠損値を除く(anyだと行に一つでも欠損値がある場合に削除,allだと行の全ての値が欠損値である場合に削除)
df.dropna(how='any')

#インデックスをリセット
df.reset_index(drop=True)

#指定の列でソート
df.sort_values(['ソートしたい列名'])







この記事が気に入ったらサポートをしてみませんか?