data:image/s3,"s3://crabby-images/c0da1/c0da192ece302589013a031b7663ecd53d6b79fd" alt="見出し画像"
[第3回] Pandasでクロス集計
jupyter notebookとpythonを利用した分析講座となっております。
Pandasを利用したクロス集計
Pandasを利用してクロス集計を試してみます。
データフレームの用意
data:image/s3,"s3://crabby-images/21c0e/21c0eb0e249d019e00daa285fd569ba89df6fe35" alt="画像1"
import numpy as np
import pandas as pd
sex = np.random.choice(['男性','女性'],size=10)
item = np.random.choice(['お皿', 'ナイフ', 'フォーク'],size=10)
price = np.random.choice([100,1000,5000],size=10)
df = pd.DataFrame({'性別':sex,'商品':item,'価格':price})
df
クロス集計方法
商品×性別(数量)
data:image/s3,"s3://crabby-images/5bdde/5bdde00b2c12aa05c8f44f76c64f8781e8ce47f2" alt="画像2"
pd.crosstab(index=df['商品'],columns=df['性別'])
(商品+価格)×性別
data:image/s3,"s3://crabby-images/e932a/e932a03aecf3aaa0a75d7d152859ff5d251a92ba" alt="画像3"
pd.crosstab(index=[df['商品'],df['価格']],columns=df['性別'])
商品×性別(価格合計)
data:image/s3,"s3://crabby-images/053f0/053f0b15451c5d3d1c96b594de15747683fe3ada" alt="画像4"
pd.crosstab(index=df['商品'],columns=df['性別'],values=df['価格'],aggfunc='sum')
商品×性別(比率)
data:image/s3,"s3://crabby-images/35773/35773ea351ec37e8d5c7a4a4af06f5c3c8e15aca" alt="画像5"
pd.crosstab(index=df['商品'],columns=df['性別'], margins=True, normalize='columns')