見出し画像

経済分析のデータ革命とその次

COVID-19を契機にこれまで表に出なかったデータの活用が一気に広まっています。特に人の動きを捉える人流データは外出自粛の状況など緊急事態宣言の実効性を確認するために不可欠であり、国内の携帯キャリアグループだけでなくGoogleやApple、Facebookといったプラットフォーマーもデータ提供に乗り出しました。報道機関も毎日のように人流データを用いたニュースを流しており、すでに生活の一部になった感があります(NHK News Web)。

感染拡大の阻止が最大の課題となる初動フェーズでは、人流データやアプリを通じた迅速なサーベイ調査で外出自粛等の遵守状況を監視するとともに、感染者数などの医療データでその実効性を確認して強化・緩和の判断をしていくことが求められます。

全世界でとられている強力な政策介入の副作用は、失業や倒産といったかたちで現れます。通常、経済分析は毎月公表される統計や、四半期毎に推計されるGDP速報によってなされますが、これらは定期検診のようなもので、病状が急激に悪化している患者を定期検診までほっとくわけにはいきません。週次、日次で集計される速報性のあるデータを使って積極的に検査して対策を練る必要があります。

下の表にあるように、日本でもすでに様々なデータが活用されています。クレジットカードの購買記録を指標化したNowcastのJCB消費NOWは速報性の高い家計支出関連指標としてメディアで注目を集めています(日本経済新聞)。経済産業省が公表している小売販売額指標も迅速な家計消費の分析に有用です(小西 2020)。

マクロミルが公開する週次の消費者サーベイ調査は同一消費者の動向を追うパネル調査として貴重です。予約サイトのOpenTableはレストラン来客数の状況を指数化して公表しています。こうしたデータはすでに政府や中央銀行の景気判断の材料となっています。

オルトデータ表

東京大学の渡辺努教授や北尾早霧教授をはじめとした研究者はすでに、自粛によるサービス支出への影響(Watanabe and Omori 2020, Watanabe 2020)や、雇用への影響の推定(Kikuchi et al. 2020)に購買データを用いています。

これらの研究はデータの速報性だけでなく購買データがもつ粒度の細かさ(granularity)を生かして属性別、業種別に影響分析することに成功しています。

Kikuchi et al. (2020)でも指摘されているように雇用への影響は今後注視しなければなりません。速報性のある雇用指標というと有効求人倍率ですが、内閣府は日次の業務データを用いて足元の状況を分析しているようです。川田(2019)のようにハローワークの個票を用いた分析をリアルタイムで実施できれば雇用情勢を監視していくことも可能です。

ただし、公共職業安定所を経由した転職というのは24%と労働市場全体を捉えるのにカバレッジが十分というわけではありません。GrassdoorBurning Glass Technologiesは、求人情報を企業のHRシステムやキャリアページ、求人ウェブサイトから取得して新規求人数の指標を公表しています。Grassdoorは自社のウェブサイトに投稿された給与データから給与の中央値についても指標化しています。オフラインの求人は把握できないという弱点はあるものの、サンプルサイズは米国の労働統計局の類似の統計の数倍となっており(Chamberlain and Zhao 2019)、一定の価値があります。

日本でも多くの企業がHRシステムを導入し、またキャリアページを開設していること、また、オンラインでの求人情報も充実していることから同様のことが可能かと思われます。

COVID-19を契機としてオルタナティブデータに着目したレポートや研究は爆発的に増えており、経済分析のデータ革命とも言える状況といえます。もともと世界には恐ろしく多くのデータが貯蔵されています。しかし、数え切れないデータのなかから有望そうなものを取り出して加工して分析の用途に使うのはエンジニアやデータサイエンティストの膨大な時間が必要で、平時にはわざわざそれをするインセンティブは誰にもありません。しかし、未曾有の危機のなか、企業はリソースを提供することに対してハードルが低くなっています。

国民生活基礎調査の中止国勢調査の対面調査の取りやめなど頼りにしていた公的統計が実施も危ぶまれるなか、オルタナティブデータの重要度はいやが応にも高まります。

自粛要請と同様に、経済政策も執行状況の把握、期待していた効果の監視、そしてフィードバックと対策の再検討というサイクルを回していくことが必要です。雇用調整助成金や中小企業等への政策金融、各種給付金といった大型の施策が迅速に実施されているのかリアルタイムで集計し、問題があれば解決していくことが求められます。

その上で、失業率や倒産件数、困窮している人の数など、政策目的の変数を実数として把握し、政策の強化や改善をはかっていくことが重要です。

すべてがインターネットとコンピューターで完結するウェブの世界では、施策の実施・効果検証・改善のプロセスがデータに基づいて行われます。実装した機能にバグがあったり、想定していた条件ではなかったりといった問題を発見し、解決するのはデータサイエンティストとエンジニアの仕事です。期待通り動いた実装が期待していた効果を生み出すのかは、ユーザーの反応を集計することでチェックします。うまくいかなければ不断に機能を改善します。

経済政策が難しいのは、施策の実施決定から実行までに関わるプレイヤーが膨大で必ずしも整合的なインセンティブを持っているわけでなく、政策の目的変数が曖昧だったり複数あったりして明確な最適化のサイクルが回しにくいといったところにあります。多くの政策は官僚機構の立案・調整を経てできた成案は与党の承認を得ることで国会提出されますが、与党や官邸が立案したトップダウンの政策が実務レベルの調整の時間が限られるまま決定されることもあります。特別定額給付金はその最たる例でしょう。

実際に政策の実施の監視・効果の測定・再検討のサイクルを実施するのは中央省庁と地方自治体や他の実施団体に委ねられるので、うまく実務レベルに落とし込まないといけません。経済政策は必ずしも事実に基づかないアイデアが具現化したものですが、その効果は想像ではなく事実として捉えられるべきであり、予想ではなく計測して確認する必要があります。

しかし、計測のためのデータを迅速に取ることは現実問題として非常に困難です。

定額給付金やプレミアム商品券、雇用調整助成金など大型の政策については政策効果分析がなされていますが、走っている政策の改善を行うためのインタラクティブな分析ではなく、実施後随分と時間が経ってからです。しっかり分析して次の危機に備えるというのはわかりますが、膨大な予算が投じられた結果、次は頑張ろうでは悲惨すぎます。

自民党規制改革チーム提言にあるように、行政手続きのオンライン化を徹底することで、少なくとも実行状況の監視は可能です。その際、国が全国で統一的なシステムをつくるなどして、規格が統一されたデータの取得をするべきです。現行の行政データは自治体によって様式がバラバラで、名寄せしたり、分析するのに相当手間がかかります(例えば、渡邊 2020)。

今は改善されたかもしれませんが、私が霞ヶ関にいた頃は、なにか分析をするためのデータがほしいときは各省庁がエクセルシートをメールに添付して自治体に送付し、それを手で入力してもらって返送してもらい、それをまた手でマージするというようなことをやっていました。人手を挟むことで効率が悪く、エラーの機会も増え、全国1000以上の自治体ごとに細かいやり方が異なってデータの規格がバラバラになってしまうという悪夢のような集計方法です。第一、この手の調査が大量にあることで自治体行政の停滞を招いてしまっています。

オンライン手続きによりユーザーに直接記入を求めサーバーにログを貯め、中央省庁の政策担当者や自治体の担当者がSQL等でアドホックな分析ができるようにすることで、職員はわざわざメールでエクセルをばらまいたりセルを埋めなくても政策の実施監視と改善に集中できます。

法令にもとづく行政手続き等は全体で約58,000種類、年間21億件以上あるそうです(内閣官房)。これだけのログデータのほとんどを蓄積せず分析に活用せず改善に使っていないとしたらもったいない。仮にこれがデータで収益をあげるテック企業であれば無能扱いでしょう。

システム開発は当然費用もかかりますが、限界コストは非常に小さいためユーザーが多ければ多いほど費用対効果は高まります。潜在的なユーザーが(これから生まれる人も含めれば)数億人いる日本なら相当効率的な運用が可能です。

実行監視により政策がうまく実施されたら次は効果測定です。冒頭にあげたようなオルタナティブデータの活用や公的統計のオンライン化・迅速化がまずは考えられます。オルタナティブデータはの活用にはプライバシーの保護や提供側の企業のインセンティブの問題があります。

幸いなことに、経済状況の把握という文脈では検索や推薦等のパーソナライゼーションと違って匿名化・集計化(+K匿名性の保持)といった措置をとった状態でも十分にデータに価値が出ます。冒頭に挙げた企業群はデータ提供に際してこの点を十分に留意しているようです。

企業のインセンティブは難しい問題です。データが価値である以上、オープンにすることは競争力の低下につながりかねません。十分なインセンティブを与えて継続的な指標を得ることが大事です。前述の経済産業省のPOSベース販売指標は成功例と言えます。

政府による政策の実行監視がそのまま効果測定になる場合もあります。失業給付申請や生活保護申請は労働者や生活者の状態の悪化を意味します。また、求人の減少や廃業に関わる諸手続きも企業の苦難を意味します。これらも現場のデータをオンラインシステムによって集約できていれば意思決定者が生きたデータをリアルタイム集計し目的変数の変化を監視できます。

冒頭に上げたオルタナティブデータの一群や、膨大な行政データの中には様々な経済の小さい変化をキャッチするデータがあるはずです。これらを丹念に調べるのは骨が折れる作業ですが、この機会にリソースをふっていくことでブレークスルーが期待できます。

データ革命を分析に留めることなく、評価・改善のインタラクティブな改善という「次」のフェーズにつなげられればと思います。

補足:本稿は現職や過去の所属組織とは一切関係なく個人の意見です。さまざまなデータの情報は主にTwitter経由で収集しました。フォローしている皆様に御礼申し上げます。

いいなと思ったら応援しよう!