Tableau Makeover Monday 2023w33 時系列データで相関係数を出す
2023w33のMakeover Monday を紹介します!
2023/W33: Energy Use per Person - dataset by makeovermonday | data.world
国別の人口1人あたり電力使用量の推移データです。元データはこちら。
何を可視化すると面白いかな?と考えたところ、
日本と電力の消費量の推移が似ているかどうか ≒ 日本と発展する水準が同じかどうか を調べたいと思いました!
時系列データを相関係数で出す場合、どんな波形になっていると相関係数が高いのか?という感覚をデータを見てつかみたいと思います。
国同士の散布図と相関係数を出すために、リレーションシップで年同士をつなぎます。
国同士の相関係数を出すために、以下の計算フィールドをつくります。
corr([Primary energy consumption per capita (kWh/person)],[Primary energy consumption per capita (kWh/person) (per-capita-energy-use.csv1)])
プライマリの国名を日本でフィルターし、
セカンダリの国名を列に入れ、
先ほど作った計算フィールドを行に入れると以下のようなグラフができます。
相関係数の高いイタリアと日本の散布図も作ります。
散布図だけだと時系列データの形が分からないので、折れ線グラフも作ります。
折れ線グラフは実数(左)と、基準を合わせるために各国で最大値を1とした指数のグラフを作りました。
ダッシュボードができたので、相関係数が高い・ない・低い国を表します。
折れ線グラフで表す場合と、散布図で表す場合だとイメージ感覚は同じですか?
ダッシュボードは以下にパブリッシュしています。
実際に動かして相関係数とグラフの形状の感覚をつかんでください!
後から考えると、リレーションシップを使わなくてもFixedを使って日本だけの値を作り、相関係数を出す方法もありました。
--日本の値
{fixed [Year]:max(if [Entity] = 'Japan' then [Primary energy consumption per capita (kWh/person)] end)}
相関係数はデータの類似度を端的に伝える一つの方方法です。
使う機会があればぜひ使ってみてください!