加工0823

data.head()
data["元データ"] =2018
data.info()
df.isnull().sum()
df.describe()
df["種類"].value_counts()
list = ["性別","年代"]
data1 = data[list]
(df_a = df[["index","survived"]])
data=data["age"].fillna(0)
df_new = df.rename(columns={'A': 'Col_1'}, index={'ONE': 'Row_1'})
df.rename(columns={'A': 'Col_1', 'C': 'Col_3'})

pd.concat([df_a,df_b],axis=0) 
#上と下でガッちゃんこする  df=pd.concat([train_df,test_df],ignore_index=True) ignore_index=Trueとしておくことで、連結するときのインデックス番号(=1番左の番号)を振り直しできます
df.reset.index()

EX)
df.groupby("survived").mean()
df = df.dropna(subset=['項目1', '項目2'])

加工後
data.groupby(["年代","性別"]).mean()
data.groupby("年代").count()
data.sort_values("年収").head()

置き換える
dis = {
"30分?60分":45, "1H?1H30":75,"1H30?2H":105,"2H?":120
}
df["最寄駅:距離(分)"] =df["最寄駅:距離(分)"].replace(dis).astype(float)

train["year"]=train["datetime"].apply(lambda x : x.split("-")[0])
train["month"]=train["datetime"].apply(lambda x : x.split("-")[1])
train["year"] = train["year"].astype(np.int)

def jisaku1(x):
if x =="お楽しみメニュー":
return 1
else:
return 0
train["fun"] = train["remarks"].apply(lambda x:jisaku1(x))

この記事が気に入ったらサポートをしてみませんか?