見出し画像

Data Saber Viz投稿②


はじめに

数日前に初めてTableau PubicへのViz投稿、そしてnoteへの記事投稿を行いました。
今回の記事は、Viz投稿の第2弾についての記事となります。
Data Saber自体、取り組む期間が90日間という制約がありますが、
それを差し引いても、鉄は熱いうちに打てという気持ちで立て続けに投稿に挑戦しました。

投稿したVizについて

今回私が投稿した2つ目のVizが以下になります。
タイトル「神奈川県の日帰り観光客数」

神奈川県の市町村を対象とした、2019年~2022年の日帰り観光客数についてのデータとなります。
今回このテーマを選んだ理由としては、
・神奈川県出身という事もあり、接点のあるものを題材にしたかった
・自治体のオープンデータを活用してViz投稿してみたかった
からとなります。
オープンデータは、神奈川県のサイトから取得しました。

データ加工について

当たり前ではありますが、オープンデータは利用者に都合の良い形式でデータがまとまっているわけではありませんので、目的に沿ってデータ加工をしてあげる必要があります。
今回データ加工をする中で特に困ったこと、学びになったことがあったのでそちらをご紹介したいと思います。

「ポリゴンデータを活用して市町村を地図で色塗りする」

まず始めに、修正前と修正後の違いをご覧ください。

修正前
修正後

市町村でマップを色塗りするには、市町村に「群」の地理的役割を与えれば良いのですが、どうやらそれだけでは問題があるようです。
横浜市は一部が色塗りされているだけ、川崎市と相模原市に至っては認識すらされていません。
この場合、地図の右下のインジケーターから場所の編集を行うわけですが、
そこでも問題が発生しました。

なんと、市として認識できず、何らかの区を指定するしか無さそうです…
横浜市が一部しか色塗りされなかったのも、中区として認識されていたからでした。
サンプルスーパーストアのデータを使っていた時に都道府県レベルで簡単にできていたことが、市区町村レベルになると同じように出来なくなる、これは実際に経験して気付けたことでした。
とは言え、これはどうにか解決したいと思って調べてみたところ、以下の記事が大変参考になりました。

こちらの記事の説明に沿って、国土地理院の神奈川県のデータをダウンロードし、観光客数データに紐づけていきたいと思います。
東京23区のデータを扱う場合は、上記の記事と同様の手順で解決できると思いますが、神奈川県の国土地理院データは市と区が2列で入り混じる少々厄介な構成でしたので、以下の計算式で紐づけることで問題が解決できました。
キーとするデータも計算式で指定できる、という事も課題の中で知った知識です。

ここまでの作業を経て、Tableau上でビジュアライズするフェーズに入ることができました。

投稿したVizの説明

今回のポイントとしては、
市町村の位置関係を把握できるようにするため地図を作成し、市町村クリック時に右側のグラフが連動するところです。

まず、地図単体としては年単位で観光客数の推移をみることができます。
そして気になる市町村をクリックすることで、右側のグラフがフィルタされる仕組みになっています。

やはり新型コロナウイルスの影響は色濃く、県全体としては2021年5月の前年比成長率が突出しています。
2020年5月は緊急事態宣言が発出されていたので、その影響かもしれません。
しかし市町村単位で見ると、主要都市や観光地と、西側の山に近い地域では若干傾向に違いが見られるのも面白いです。

取り組んでの感想・課題感

今回扱ったデータは日帰り観光客数でした。
宿泊観光客数のデータもあるにはあったのですが、欠損のある市町村が多く集計には加えませんでした。
今後、宿泊のデータも入れるとより傾向が見えてくるのかなと思います。

また、今回前年比成長率を指標として可視化しましたが、2020年以降がコロナ禍以前の水準と比較してどうだったかを見る場合には、初年比成長率のような指標が適切かもしれないと思いました。
パラメータによって指標を切り替えられるアップデートを今後してみるのもよいかもしれません。

いいなと思ったら応援しよう!