Tabeleauでおもち消費額を可視化しつつLOD計算を学ぶ!
今回はDATA Saberのコミュニティ活動#3、Tableauを用いて全都道府県におけるお餅消費額を可視化するVizを作成しつつ、LOD計算を学ぶ流れとまとめを記録したいと思います。
今回作成したVizはこちらから
データの取得/作成
お餅消費額のデータ
統計局HPより「家計調査(二人以上の世帯)」を参考にしました。
加えて、都道府県と地域区分のデータを別に準備しました。
以下、参考までに。
※データは、都道府県庁所在地の市をベースとしていますが、ここでは便宜的に都道府県別として取り扱っています。
※数値は、都道府県民1人当たりの数値です。
※総務省統計局「家計調査」から各都道府県の1人当たりの支出金額を算定しています。
データ結合
「都道府県」でリレーション結合
地域区分を入れるため、お餅消費額データと地域区分データをインナージョイン
LODで粒度別に試算
今回のポイントは、前回のたらこ消費額のVizぽくしつつLOD計算を学ぶです。
まず、<各都道府県別消費金額>をメジャーに入れてみます。
その横に<地方別消費金額>をメジャーに入れます。すると、地方別に金額が入っていることが確認出来ました。これはLOD計算で<地方>を固定することで算出できます。以下。
次に、<地方>別の平均を出します。
今回は集計計算を使わず計算式で<都道府県>/<全国>と、<都道府県>/<地方>の割合を出してみます。
出来上がり
今回は、せっかくなのでランキングにもしてみました
都道府県別と地域別の違いを見てみたかったので2種類を地図にて可視化しています
せっかくLOD計算したのでアクションで表に飛べるようにしました
考察
中部地方がお餅はアツい!
地図上でみると、中部~関西にかけて消費量が多いようです
調べたところ、歴史的には江戸時代に和菓子の流通量と共にお餅菓子も流通し、神社仏閣が多い宿場町が栄えたことでお供え物としての餅文化が広がった説がありました
東北地方がそこまで消費額が高くないことも驚きでした
苦労したこと
どの時点で何の影響を受けるかを把握していないと、なんでだろう?という疑問から抜け出せなくなりそうなのでしっかり、クエリパイプラインを身に着けたいと思います。