見出し画像

Tableauのパラメーターとブレンディング機能を使って「全国高等学校野球選手権大会」の優勝校データを調べてみた

こんにちは、TableauDataSaberを目指して勉強中のmikuです。
今年の夏も暑い暑い球児たちの夏が終わってしまいました。
毎年、高校野球が始まると夏を感じ、終わると秋の始まりを感じます。。

仙台育英の東北初優勝は涙した方が多かったのではないでしょうか。
東北初優勝だったという事実を私が知らなかったため、過去の優勝校データから「どの高校が一番優勝をしているのか」「地域/都道府県別にみるとどの地域/都道府県が一番優勝しているのか」をTableauを使って可視化してみました。

作成したTableauはこちら


1.全国で一番優勝している高校はどこか

「中京大商業高校(現中京大中京)」と「広島商業高校」が6回と優勝した数は同率1位です。
しかし、「中京大商業高校」は現在の「中京大学附属中京高等学校」なので、合算すると優勝回数は7回となり優勝回数は1位となります。全国各地の激戦を勝ち抜き、甲子園のキップを手にした49校の中から優勝をするだけでも凄いことなのですが、更に7回も優勝するなんて、、!

2.地域/都道府県で見るとどうか

地域別にみてみると、近畿地方が圧倒的に優勝回数が多いことが分かります。PL学園や大阪桐蔭など強豪校が多い大阪府は断トツで1位ですね。

ここでTableauTipsの紹介です。

▼TableauTips①

今回こちらのサイトから優勝校データを参考にさせて頂いたのですが、困ったことが2つありました。解決のアプローチについて下記に記載をします。

①高校名と件名がセットのデータであること

下記の様に、「高校名(県名)」という記載になっており、県名単位でディメンションを作り分析することが出来なない。。

京都二中(京都)

そこで、データ読み込みをした後Tableauの「カスタム分割」機能を活用することによってTableau上で簡単に「学校名」「都道府県」を分けることができました。

データ内の文字列フィールドに複数の情報単位 (顧客の氏名など) が含まれる場合、フィールド内の値を別々のフィールドに区切るとデータを分析しやすくなる場合があります。Tableau の [分割] と [カスタム分割] オプションを使用すると、フィールドの各行に存在する区切り文字や値の繰返しパターンに基づいて値を区切ることができます。この例では、一般的な区切り文字としてスペース文字 "( )" が使用されています。

Tableau公式HP抜粋(リンク

②地域のデータがないこと

次にぶつかった壁としては、地域という軸で分析をしたかったのにもかかわらず「地域」データがない、、

そこで、こちらのHPから「地域/都道府県」形式のテキストをコピーし、
データソースに貼り付け。すると、簡単にデータ追加をすることができました。このようにデータをどんどん追加することができるのはとても便利。
①で使った「カスタム分割」を使い「地域」と「県名」を無事データ追加することができました。

次に、都道府県名を「優勝校県名」と元データ(プライマリデータソース)のディメンションと同じ名前に書き換えることによって、地域単位の分析軸を追加することができました。

▼TableauTips②

また、ダッシュボードで一覧にする際はパラメーター機能を使い「地域」と「都道府県」を切り替えすることができるように設定するなど表示の工夫もしています。

まず、パラメーターを作成します。
ここでは「都道府県」と「地域」の切り替えをしたいため2つの表示名を記載します。

次に、先ほど作成したパラメーターを使った計算式を作ります。

それから、計算フィールドの「地域/県切り替え」をフィルターの入れて表示名に対応した値にチェックを入れます。

最後に、それぞれのチャートを広くスペースを使って表示するためにはレイアウトコンテナーを使います。今回は垂直方向のレイアウトコンテナーを使い、それぞれのシートを入れていきます。
そして、パラメーターを表示させると切り替えができるようになります。


3.最後に

分析するデータ自体は簡易でしたが、分析軸の追加、ダッシュボードの見せ方について工夫をしてみました。
次はもう少し複雑なデータを読み込んで、違う角度から高校野球の理解を深め来年の応援に活かせればと思います。

参考データ(リンク


いいなと思ったら応援しよう!