自治体目線でのオープンデータ提供までの道のり【静岡市の人口ダッシュボードを作ってみました その4】
静岡市の人口ダッシュボードを作ってみました。こちらが作った人口ダッシュボードです。
この人口ダッシュボード、これまでもnoteで記事にしてきました。今回は、自治体目線でのオープンデータ提供までの道のりとして、人口ダッシュボードの作成を例にしたオープンデータ化の話です。
その1の記事 ➡ 「静岡市の人口ダッシュボード作ってみました」
その2の記事 ➡ 「静岡市の人口ダッシュボード作ってみましたその2」
その3の記事 ➡ 「静岡市の人口ダッシュボード作ってみましたその3」
利用データのオープン化(住基データ)
今回の人口ダッシュボードで利用した人口データは、自治体からの住民基本台帳を扱うシステム(住基システム)から出力された統計データを、オープンデータ提供したものです。そもそも、住民基本台帳は何って話は割愛します。
ちなみに自治体から提供されるデータは、そのまま利用できる場合や加工をしないと利用できない場合など、自治体によってレベルは様々です。
なぜ?ですが、提供までのハードルがありそうです。まずは提供するまで、どんな作業があるのかを想定してみました。
これは手間になりそうです。本来は行うべき作業ではないもあります。
特に修正を行わないと「セルが結合されているエクセルデータ」やPDFでの提供が多くなります。その場合、機械的に取り込むことができないデータとなってしまいます。ある方がよく言っています、餅から米はつくれないと。
ちなみに、人口ダッシュボードを作成するのに一番時間がかかったのは、データクレンジングと呼ばれる作業でした。PDFやエクセルは人が見る前提でレイアウトになっているんですよね。
なぜこうなるのでしょうか? それは、提供者側に「データが利用される」を前提とした考えが根付いていないことが一因だと思います。考えを変えるには、提供者側のメリットが必要です。メリットに感じるのは、以下のようなことでしょうか。
しかし、業務を行う担当者は、データ提供が追加の仕事として負担に感じると思います。そのため、データの利活用がイメージできない状況では、データ提供を「やらない」選択肢が出てくると思います。やり始めても、継続ができないでしょう。
利用イメージに繋げるには、今回のダッシュボードのように利用例を見てもらうことも一つの考えだと思います。
そもそも、データの流通により様々な価値が生まれるには、標準的なデータを日常的に流通し利用できる必要があります。
そこで、利用できるオープンデータを提供のためには、何が必要か、自分の考えを書きました。まー、個人的な趣味で書いたと思ってください。
1.第一歩は何からなのか
住基システムから出力したデータから考えてみます。
現在、住基システムは地方自治体ごとに整備、SIerと呼ばれる企業さんが地方自治体にあったシステムを導入しています。その際、システムから出力できる統計データは、システム導入時にSIerと自治体の担当者間で決めた独自の形式になっていることがあると思います。
特に、データが他のサービスに利活用できるイメージは、システム導入時には企業、自治体双方が想定はできないことが多いと思います。
このままでは利活用できるデータ提供にはなりそうにありません。
本来なら、オープンデータ提供用に修正しなくても、標準的なデータに最初からなっているが理想です。
そのためには、以下のことができるとよさそうです。
上記の中で、3が短期的には対応できそうです。なお、個人業務になることは課題ですが、組織で動ける神戸市は凄いなと、理想形を見ました。
ちなみに、自動でオープンデータ提供できればいいのですが、地方自治体のネットワークは三層分離となっており、住民基本台帳など基幹系システムから自動的にインターネット層にデータを移行することができません。色々と難しいですね。
2.今後の解決方法はあるのだろうか
住民基本台帳からの出力された人口データを例にしましたが、行政が扱うデータは様々あります。特に地方自治体業務に深く関わる基幹システムで扱われるデータを、統計データとして提供すると利用価値がありそうです。
この基幹システムは、システム標準化の流れになっていますが、合わせて、統計データなども全国標準化されるのが理想のような気がします。
では、今後、基幹系システムを例にとって、オープンデータなどのデータの二次利用に取組むには何が理想なのか考えてみました。
これを基幹系システムで解決する場合は
基幹系システムのデータ標準化は進んでいきますが、基幹システムが標準化もシステム開発はSIerさんが行っていくことは変わりがありません。そのため、システム開発からデータ標準化の思想が必要ですが、以下のような課題がでてきそうです。
本当に実現できるか? 取組む必要があるのか? はさておき。
これは、地方自治体ごとに実施するのは現実的ではなさそうです。
ここまで、ボトムアップで考えてきて、ようやく政府が考えていることが自分の中で腹落ちできるようになってきました。
まずはデジタル庁より行政の主要データの整理の考え方が出ていました。国にて方向性を示されることが、最終的な情報源となる地方自治体からの品質の高い標準化されたデータ提供の一歩だと思います。
また、データが標準化されてもデータ流通がされなければなりません。データ流通に関して、デジタル庁の政府相互運用性フレームワーク(GIF)の整備が参考になりそうです。
こういった、共通ルールや技術体系があってのデータ流通ができないと、データ利活用は進まない話ですね。
今回のダッシュボードに戻りますが、わかりやすいデータ利用例が示されることで、データ利活用の重要性が社会に認識されるのではないでしょうか。データが流通し新たな価値が生まれるような社会に近づければいいなと思います。
話は飛びますが、最近、生成AIを利用したデータ構造化のnote記事を読みました。生成AIのサービスが誰もが利用できることになったことで、個人の発想から標準的なデータ提供につながるんだと感動しました。
データ構造が標準化されていなくても、後から簡単に標準化できそうです。これは個別のデータごとに対応のため、全国で標準化されたデータが流通されるのが理想なのは変わりません。
ただし、LLMを応用した生成AIを誰もが利用できるサービスは、個人の発想によって様々な取り組みができるようになったと感じてます。
個人のアイデアがサービスに繋がる、これはデータ標準化やデータ流通の世界でも現実的になってきそうです。
今回の記事は、昔から関わっているAPIによるデータ流通で考えていたことを元した、個人的な記事です。生成AIの爆発的普及は、APIによるデータ流通が前提となる社会に一歩に近づくと実感しているところで、今回の記事を終わりにしたいと思います。
人口ダッシュボードのデータ
ちなみに、今回作成したデータはGitHubからcsvで取得できるようにする予定です。いつになるんだろう。できるようになったら、記載します。
※人口ダッシュボードの作成方法のスライド資料を載せたnote記載しました。GitHubからのcsv取得も記載しています。
#人口動態 #ダッシュボード #地域・行政 #DX #オープンデータ
この記事が気に入ったらサポートをしてみませんか?