ジッタープロットを用いた箱ひげ図の作成(#WOW2022 W12)
#WOW2022 W12にトライしたので、このテーマを選んだ理由と有用性について本ブログで紹介させていただく。
【このテーマを選んだ理由】
箱ひげ図は以前から度々業務で作成することがあったが、プロット同士が重なり合ってしまい、ただしくメジャーボリューム/マイナーボリュームを認識するのが難しいなと感じていた。ちょうどその際にWOW2023で適切なテーマを見つけたためトライすることに決めた。
【ジッタープロットを用いた箱ひげ図の有用性】
ジッタープロットを用いることの有用性は以下の2点が挙げられる。
データの分散の視覚化:ジッタープロットを用いた箱ひげ図では、データの分布がどの程度広がっているか、あるいは特定の範囲に集中しているかを一目で理解することができる。これによって詳細なデータ分析が可能になる。
異常値の確認:ジッタープロットを使用することで、異常値や外れ値を視覚的に確認することもできる。箱ひげ図と組み合わせることで、これらの異常値が全体的なデータ分布にどのように影響を与えているか評価することができる。
【このテーマで学べたこと】
・ランダム関数
・網掛けの設定のバンドサイズとレベル
【ジッタープロットを用いた箱ひげ図で出来ること】
私が作成したVizは以下のリンクから確認することができる。https://public.tableau.com/views/WOW2022_W12_MLB/WOW2022_W12_MLB?:language=ja-JP&:display_count=n&:origin=viz_share_link
なお、作成する際の制約については、https://workout-wednesday.com/2022w12tab/を参照のこと。
ジッタープロットの作成は、シンプルで、列にrandom()関数を入れることで、ランダムプロットが可能になる。
ダッシュボードではPlayoff進出チームとそうでないチームで、属性を分け、年齢の中央値が高い順にソートをおこなった。
Vizから、年齢の中央値が最も高いのが、ボストン・レッドソックスで、中央値が28.5歳であることがわかる。
いかがでしたか?
みなさんもジッターグラフをぜひ試してみてください。