行政データは経済センサスを代替できるか
統計調査が直面する困難
前回記事でも書いたように国民生活基礎調査の中止、国勢調査の公表延期など公的統計の作成が難しい状況が続いています。
この状況以前から、調査員の確保の難しさやオートロックマンションの普及、個人情報への意識の高まりなど、調査員による統計調査の実施は難しいという認識は統計作成者の間では一般的でしたが、そもそも外出や対面が困難になるという状況は、それを一層深刻なものにしています。
あらかじめ決まった事業所や世帯に対してオンラインや郵送による調査が可能なサーベイ調査はともかく、調査員が担当地域を悉皆的に調査するセンサス調査は非常に困難になることが予想されます。センサス調査はすべての統計の根本であり、これが崩れるとGDPを含めた統計体系が維持できません。
今回は、調査員調査を使わずにセンサスを作成する可能性について考えてみたいと思います。
経済センサス
経済センサスは、2009年から始まった全国の企業・事業所数や従業員数などを調査する日本経済に関する基礎的な統計です。GDPのもととなる基礎統計として活用されたり毎月勤労統計の標本抽出の元データとなるなど、経済統計の基礎といえます。経済センサスは、基礎調査と活動調査に分かれ、3年に一度実施されることになります。基礎調査は調査員が担当地域の事業所をしらみつぶしに把握する必要があるので負担が重く代替データの活用が待ち望まれます。(注1)
食品営業許可データ
今回、代替データとして使うのはキカク株式会社が提供する食品営業許可データです。飲食店や食品の製造を行う事業所は、食品衛生法や各地方自治体の条例にもとづいて許認可を得る必要があります。
これらは各地方自治体の保健所が公衆衛生や食品衛生を確保するために行なっていることですが、許可を得ずに勝手に営業することは法律や条例に違反する以上、営業しているすべての食品関係事業者は少なくとも一つ以上の許認可をとっているわけで、食品の製造や販売事業所、飲食店など特定の分野に偏るものの悉皆的に事業所を特定するには最適のデータと言えます。
東京都の食品衛生関係のウェブサイト
行政データで経済センサスを再現する
残念ながら、許認可データには従業員数や資本金といった事業活動に関するデータはないのですが、どういった主体がどこでいつ営業を開始/停止するといった情報が含まれています。
行政データによって経済センサスのもととなる事業所のリストが復元できればあとは郵送やオンラインで対応すればいいので調査員基礎調査は不要になります。このリストの作成というのが非常に大事で、例えば、サーベイ調査の回収率が低かったとしても母集団の情報がわかっていれば補正をかけることが可能です。
データマッチング
最新の令和元年経済センサス基礎調査の詳細な結果がまだ公表されていないので、平成26年の調査結果を用います。市区町村別、産業分類別に事業所数を公表しているので、経済センサスの産業分類と食品営業許可データにおける業種分類のマッチングをかけることで市区町村別、産業分類別の事業所数のデータを作成します。ここら辺の作業は自動化したいところですが、今回は目grepでやりました(注2)。
食品営業許可データは地方自治体ごとに管理されているので業種分類が必ずしも統一的ではないのですが、このデータではすでに規格化されたカテゴリーが別のカラムで用意されているので容易でした。
結果
まず、事業所数の分布を経済センサスと食品営業許可データで比較してみます。今回は東京都東部(中野区除く)を可視化します。(注3)
経済センサスの産業別事業所数と食品営業許可データの関係は、食品営業許可データの方が数が多いという関係になっています。これは、データをとっている年が違うことに加え、一事業所が複数許可を取ることがあるためです。割ときれいな線形関係になっていて許認可データでセンサスデータを予測できそうな雰囲気です。
市区町村別の事業所数(対数)の関係
次に、それぞれのデータについて、行政区画ごとに事業所の割合を計算して地図上に可視化します。
経済センサスによる飲食店の事業所分布
飲食店営業の許認可データによる事業所分布
上が、経済センサスによる産業分類「76 飲食店」の事業所分布、下が、「飲食店営業許可」をもつ事業所の分布です。経済センサスが2014年、許可データは2019年ということや、許可データには中野区のデータがないことなどの齟齬はあるものの、新宿区、港区、中央区に飲食店が集中していることがわかります。2019年への変化としては墨田区がここ数年で飲食店が急増していることがわかります。
次に、マニアックな産業分類「583 食肉小売業」と食肉販売業の許可事業所の比較もご覧ください。上がセンサス、下が営業許可データです。
経済センサスによる「食肉小売業」の事業所分布
食肉販売業の許可をもつ事業所分布
飲食店とは異なり、世田谷区や大田区、足立区など外側の区に集中している様子が確認できます。分布を推移を確認するのであれば十分といえます。
行政データ版経済センサスにしかできないこと
行政データ版経済センサスは、経済センサスの簡易版というわけではありません。優れている点もあります。
まずは、リアルタイム性です。食品営業許可データはつねにアップデートされます。新しい店舗がオープンする、あるいは店舗を閉じるという情報がすぐに反映されます。許認可は実際の開業より先んじて取得する必要があるので未来の情報を反映します。これはセンサスデータでありながら、リアルタイムの経済活動の情報も得られるという意味で、経済センサスの基礎調査とサービス産業動向調査のようなサーベイ調査のハイブリッドな性質をもつことになります。
さらに、経済センサスは集計された情報しか公開されませんが、食品営業許可データは個票単位のデータなので市区町村レベルではなく、繁華街ごとの動向をみたり、細かい業種の動向をみるといったきめ細かい分析が可能です。さらにいえば、ひとつの事業所が複数の許認可データをもっている点で個票レベルでも経済センサスより複雑な情報を持っています。
まとめ
今回は、食品営業許可データを用いて経済センサスの一部を再現することでデータの悉皆性を確認しました。実はまだほかにも面白い分析ができるので、順次公開していきたいと思います。データについてご関心のある方は、ぜひbosyuのページをご覧ください。
注釈
注1 同様の発想で行政記録を活用した母集団データベースの整備が進められているが、代替するまでには至っていない (https://www.soumu.go.jp/main_content/000551984.pdf)
注2 目によるgrep(linuxコマンドのひとつでパターンマッチしたレコードを探す)
注3 諸事情により中野区のデータがとれていない
改訂履歴
8/5 事業所のグラフが実数の対数ではなくて割合の対数になっていたので修正しました。