オープンデータをTableauで可視化してみる
普及はしているオープンデータ
オープンデータとは といったところの説明は省きますが、
平成29年に閣議決定された「世界最先端IT国家創造宣言・官民データ活用」の中で、「平成32年度までに地方公共団体のオープンデータ取組率100%を目標とする」という政府の指針のもと、平成30年には都道府県単位の取組率は100%を達成するなど自治体によるオープンデータの取り組みは一定の普及をみせていると言えます。
デジタル庁が公開している最新のデータによると令和5年6月1日時点で取組率は約81%(1,449/1,788自治体)となっています。
デジタル庁,オープンデータ取組済自治体資料:https://www.digital.go.jp/resources/data_local_governments/
オープンデータの課題
オープンデータへの取組率は十分高いものの、公開されているデータ全てが分析の場面で活用しやすいものかといわれると全くそうでもないのが現状です。
例えば、データが画像やPDF形式で公開されていたり、推奨データセットは存在するもののデータ形式に揺らぎが生じてしまっていたりといったケースがあります。また、東京市町村自治調査会が出している「基礎自治体によるオープンデータ化と利活用の可能性に関する調査研究報告書」(2017年の報告書なので少し古いですが)によると、以下のような課題が挙げられています。https://www.tama-100.or.jp/contents_detail.php?co=ser&frmId=692
・「出せるデータ」だけではなく「利活用してほしいデータ」のオープンデータ化ができていない
・取組の担い手不足と体制づくりができていない(マンパワー不足)
・データの更新、運用作業が負担である
こうみると、データを提供する側とデータを活用する側の両者に言い分があるように思われます。私個人の解釈としては
自治体「とりあえずオープンデータ化しました」
利用者「なんか使いにくい、データ加工も手間だし…」
自治体「誰も使ってくれないし、人手不足なのでこれ以上整備しません」
利用者「欲しいデータがないな…」
という流れになりがちなのかなと思っています。これは両者の思考をかなり
端折っていてかつあくまで個人の解釈なので、実情と異なるかもしれませんが少なからずこのような悪循環にハマっているケースはあると思います。
DataSaberプログラム ord4 に「データは見られると美しくなる」とありましたが、それは裏を返すと「データは見られないと汚いまま」とも言えます。
前置きが長くなりましたが今回は「データは見られると美しくなる」という信条に則り、自治体が提供しているオープンデータをTableauを使って可視化しようと思いました。
今回使うデータ
今回は岐阜県高山市が公開している「AIによる人流計測」データを使用しました(https://www.city.takayama.lg.jp/shisei/1000062/1004915/1012977/index.html)。高山市は古い町並み(国選定重要伝統的建造物群保存地区)や豊かな自然資源を活かした観光業が盛んです。
前段のところで「オープンデータは活用しにくい場合が多い!」ということを前面に出してしまいましたが、高山市が出しているオープンデータはかなり形式が整えられていると感じます。
今回可視化対象とした人流データは、高山市内の数箇所に設置された顔認識システムによって収集されたもので、日時、通行人数、性別などがデータに含まれています。
以下、使用したデータ
駅前東口(飛騨高山観光案内所の東側広場)
・時間帯別通行人数
・時間帯別性別年代別通行人数
上三之町通り(飛騨高山まちかど観光案内所前の南北の通り)
・時間帯別通行人数
・時間帯別性別年代別通行人数
本町通り(本町3丁目EaTown前の南北の通り)※令和4年6月30日まで
・時間帯別通行人数
・時間帯別性別年代別通行人数
行神橋(本町4丁目大政前の東西の通り)
・時間帯別通行人数
・時間帯別性別年代別通行人数
可視化してみる
①マップの作成
まずはカメラが設置されてる位置を地図上にマッピングします。
データには緯度経度情報は含まれていないので、おおよその位置になりますがネットで位置情報を検索し、以下のような計算式で無理やり緯度経度情報を追加しました。(もっとスマートな方法ありそう。要改善)
追加した緯度経度を元にマップを作成。ここが観測地点です、ということを表すために「形状」で逆三角形に設定。
②年月推移を作成
測定人数の推移をエリアで作成。元データでは年/月/日が別カラムになっていたので、MAKEDATEで日付データを作成。日付はスライダーでフィルターできるように設定。
③時間別推移を作成
時間別の推移を男女別で作成。
①〜③を用いてダッシュボードを作成
マップ上の測定箇所を選択することでフィルターできるように、ダッシュボードアクションを設定。データ元も忘れずに記載。
Tableau Publicに投稿し、以上で可視化は終了です。
https://public.tableau.com/app/profile/yamamoto.satoshi/viz/2023_7/sheet3
可視化結果を見ると、やはりコロナの影響は大きく緊急事態宣言が出されたタイミングでは大きく測定人数を減らしております。
しかし、2022年5月4日にはデータ取得期間中では最多となる58,628人/日(4箇所合算、本町通りのデータが2022年6月までなので最多というのはあくまで参考)を記録し、2023年の同時期もそれに近い数字を記録しており、今後さらなる活況が見込まれそうです。
今後は
TableauPublicに投稿したのでとりあえずヨシ!とはならないのは承知しているつもりです。また、単体のデータで見るより他のデータとの掛け合いでより価値あるものとなっていきますし、もっと人の目につくところにどんどん出していく必要があると考えています。
冒頭でオープンデータの悪い点ばかりに言及してしまいましたが成功例ももちろん多くあります(オープンデータ
100, https://www.digital.go.jp/resources/data_case_study/)。
また、地域経済分析システム(RESAS:リーサス)、V-RESAS等を使ったコンテストが開催されており(https://contest.resas-portal.go.jp/2023/index.html)、こういったイベントやコンテストに参加し対外的にオープンデータの持つ可能性を継続的にアピールしていくことが大切なのかなと思っています。
#オープンデータ #Tableau #DataSaber挑戦中