![見出し画像](https://assets.st-note.com/production/uploads/images/131834342/rectangle_large_type_2_961721978425740d0218326e02d572e9.png?width=1200)
python pandas crosstab クロス集計
2つ以上の項目を交差させて集計する手法クロス集計を行う crosstab関数。
同じ値をカウントします、数値を足し算するわけではありません。
引数indexに基準の縦軸となるseriesを設定、引数columnsにクロス集計するseriesを設定する。
pandas.crosstab( index=df["カラム名"] , columns=df["カラム名"] )
例(下表)として産地を基準にデータをまとめ、それを品名と価格2つのカテゴリで分割し集計する場合
df_new = pandas.crosstab( index=df["産地"] , columns=[df["品名"] ,
df["価格"]] )
![](https://assets.st-note.com/img/1708215143002-dwiJK91eE1.png?width=1200)
産地と品名を基準にデータをまとめ、それを価格で分割し集計する場合
df_new = pandas.crosstab( index=[df["産地"] , df["品名"]] , columns=df["価格"] )
![](https://assets.st-note.com/img/1708692915648-GuXSDGGbGv.png?width=1200)