
【DATA Saber挑戦】Viz作成(長野県の山岳遭難のデータを使ってみた)
挑戦期間 残り33日・・・。
2回目のViz作成完了です。
テーマの選定
先日、DATA Saberの方のお話(会社のサポート会)の中で「自分の好きな事をテーマにすると分析が面白い」と、「プロ野球」をテーマとした分析Vizの説明してくださりました。
とても面白そうにみえましたので、自分も趣味関連をテーマにしてみようかなと・・・(笑)
一昨年北アルプス登山がとても楽しかったのでまた行きたいなと思ってたので「登山に関すること」ことと、「情報取集しやすいこと」で「長野県の山岳遭難」をテーマにしました。
地図のマッピング(緯度経度の変換)
サイトから引用した場所情報をtableauへデータ追加をすると60進法の「文字列」形式で表示されます。
10進法の「数値(小数)」へ変換が必要です。
◆tableau計算フィールドでやってみる



◆Excelで変換→tableauへ取り込み

ということで、長野県の山頂位置情報を無事(?)にtableauへ取り込めました。
tableauの中で上手く変換する方法があるのかな?
一つのダッシュボードで複数のデータソースにフィルタをかける?(リレーションと結合)
山頂名をクリックしたらフィルタがかかるはず・・・だったのですが反応なし?

原因が分かった今 当たり前のことなのですが、最初に複数のデータを「リーレーション」または「結合」していなかったことでフィルタがかからなかったようです。
今回「山岳遭難一覧」「山岳位置情報」「山岳ルート情報」の3種類のデータを使用しました。
Viz作成の際 ワークシートへドラック&ドロップしていった結果、最後にダッシュボードでフィルタ設定するまで気づきませんでした。
最初にきちんと準備しないとダメですね・・・。
◆結合
Vizに表示したいレコード数は全302レコードです。

結合にすると・・・、961レコードが表示されます。
「山名」で結合すると、山頂までの登山ルートは複数あるため、重複して遭難者データが表示されてしまします。

今回は「結合」を使うことができません。
◆ブレンド

今回の使用目的が「一つのダッシュボードで複数のデータソースにフィルタ設定」でしたので、問題なく設定できました。
ただ、本来は粒度の違うデータ同士をくっつけたい場合(データごとに集計→合体)に使用します。
基本は結合(データを合体→集計)ですが、事情によりブレンド機能を使用する際は集計結果に違いがでる場合があるので注意が必要です。
◆リレーションシップ

リレーションは「山名」をキーとして合体しても、データそのものは独立しているためレコードの件数や表示に影響がありません。
また、結合と違いユーザーが結合キーを指定しなくても、自動(tableau)でキーを選択してくれるので簡単に利用できます。

完成形と次へ

【データ利用元】
島崎三歩の「山岳通信」/長野県 (nagano.lg.jp)
信州 山のグレーディング/長野県 (nagano.lg.jp)
長野県の山 | 国土地理院 (gsi.go.jp)
身についたこと(知っているはず?だけれど使いこなせていなかった)
●地図へデータをプロットする際の準備(データ変換など)
●複数データの接続方法と必要性
今回できたことを忘れないようにしないと・・・。