分かりにくいワクチンデータ開示
データを大事にする。出展は忘れてしまったのですが、データの開示側が持つべきリテラシーを見たことがあります。「データ開示側がデータを大事にしているか」にも書きましたが、公開する側がデータを大事にしているかを知るには、
公開する側がデータを
(1) 合理的なフォーマットで
(2) 正確な数字が定義と出展と共に
(3) 漏れなく
(4) 定期的に
(5) 常に同じ場所で
公開しているか。
を見るとわかります。
今日は、ワクチン接種状況の詳細を改めて探しいて、あまりにもこの当てはまらないと感じたので、そのことを書いてみます。
今、知りたいのは、県別、年代別、男女別、接種回数別、接種日別データです。
元はここからでしょう。https://cio.go.jp/c19vaccine_dashboard
読むと、2022年1月24日にリニューアルしたとあります。先行公開として
というページもありました。3回目ワクチンに対応する、と言う意味でしょうか。
しかしいろいろ眺めていても、よくわからないです。それでもこれまでにわかったことを整理してみます。
まず、仕様はここ。データは3種類。都道府県別接種回数詳細、接種日別接種回数サマリー、都道府県別累積接種回数サマリーがあります。
「すべてのデータは data.vrs.digital.go.jp ドメイン配下で提供します。」と記載されていますが、このドメインではなく、vrs-data.cio.go.jp ならば開けます。(今後、このドメインにかわるのかも知れませんが、今日現在ではデータはダウンロードできません。「この XML ファイルにはスタイル情報が関連づけられていないようです。以下にドキュメントツリーを表示します。 」と表示されます。)
例えば、
vrs-data.cio.go.jp/vaccination/opendata/2022-02-03/prefecture.ndjson
であれば、ダウンロードできます。
都道府県別接種回数詳細:県、日、男女、年代(65歳以上、65歳未満、不明)、何回目か、のデータは存在する。フォーマットは、ndjson。問題は、登録日であって接種日ではないこと。そして65歳以下をどう区別するのかわからないこと。
リンクは
vrs-data.cio.go.jp/vaccination/opendata/2022-02-03/prefecture.ndjson
vrs-data.cio.go.jp/vaccination/opendata/latest/prefecture.ndjson
などです。
接種日別接種回数サマリー:接種日だと期待できましたが、実は日毎、1回目、2回目、3回目の累計だけです。県別ではありません。
都道府県別累積接種回数サマリー:県別ではありますが。合計値のみ。その時の最新値が出るだけのようです。
以上、オープンデータの仕様を見て来ました。最初に書いた
(1) 合理的なフォーマットで
(2) 正確な数字が定義と出展と共に
(3) 漏れなく
(4) 定期的に
(5) 常に同じ場所で公開
を見ると、中々興味深いですね。
(1) フォーマッについて。CSVとndjsonがあるので、あまり良いとは言えないかも知れませんが、まあ問題ないでしょう。
(2) 出展は明らかで、定義も一応記載あります。年代など、もっと詳細に分ければよいのに、という不満はあります。あと接種日別の情報が、県別にないなど、もっと出せる情報があるにも関わらず出していないことがわかります。
(3) 漏れなく、については、医療従事者が別の所にあるかなど、とてもわかりにくい。
(4) これは一応できているようです。
(5) リニューアルの名目で場所を変えているので、望ましいとは言えないと思います。そして一番は、「/vaccination/opendata/{dt}/prefecture.ndjson」の部分。{dt}の部分は、その日付を変えて行かないといけない。わざわざリンク先を変える理由がわかりません。同じ場所で、とは言えないと思います。
(追記しました)
やはり「県別、年代別、男女別、接種回数別、接種日別データ」は見つけることができていない、というのが現状です。(ご存じの方、教えて下さい!)