計量経済学Econometrics とは。データサイエンスと何が違う?
今年、計量経済学とデータサイエンスにあたる機械学習・AIを両方学習し、ある程度違いが見えてきました。もともと似てるのかなと思っていましたが、結構目的が違い、やっていることも違いますね。
経済学部生の視点から、計量経済学とはまずどんな学問か、データサイエンスとどんなところが違ったか、をまとめときたいと思います。(ただの学生なので厳密性の保証はないです、ご了承くださいm' 'm) (記載は計量経済学2019参照)
まず結論から言うと、計量経済学は経済モデルを実証するため、厳密な因果関係を観察データから導き、政策に応用するための学問。
予測とプログラミング、製品化ー>機械学習(データサイエンス)
経済モデルの実証、施策への応用ー>計量経済学
計量経済学の目的:経済モデルを実証する
計量経済学はもともと経済学の中で独自に発展を遂げた実証研究のための学問です。経済学に求められることは、人や企業、国(経済主体)の行動原理のモデル化と実証です。そして、政府や行政(や企業)はそれに基づいた政策を実行して、ソーシャルウェルフェアを最大化させていくことを目的にしています。
経済学はそのため2種類に大きく分けられ、理論系と実証系に分けられるといいます。理論系には、マクロ経済学やミクロ経済学等が含まれ、実証系ではこの計量経済学や理論の実証研究(応用計量経済学)が含まれます。
計量経済学は、この理論の実証研究のための手法を研究することがメインテーマです。どのような場合にどんな手法でデータを扱えば、正しく理論が実証されるか、ということです。そして応用計量経済学では、それらの手法を使い、今までに作られた経済モデルをデータをもとに実証し、そのモデルが正しいもしくは間違いと証明したり、新しいモデルや変数が必要だったと発見をしたりします。
なぜ独自に発展を遂げたか、というと、経済学独自の特徴が大きく2つあり、それが原因といいます。
一つは、データが実験データではなく観察データであること。実験データとは実験室などで自分で環境や変数を操作し、結果を取得する方法で理科の実験のようなものです。一方経済学では、対象が国や企業群、人々など、実験をするには金銭的な制約、倫理の制約、時間の制約があり難しいことが多く、基本はすでにある利用可能なデータ、観察データを使います。そのため、外的要因により、結果の因果関係が左右されることが多く、いかにその因果を担保するかに多くの努力が割かれています。
もう一つはパネルデータという、一定期間の個体ごとのデータを扱うことです。基本は時間T×個体Nのクロスディメンションなデータとなるため、それらを扱うための理論が必要だった、とのこと。
(ここから先では、計量経済学、応用計量経済学合わせて計量経済学といいます。)
計量経済学でやること:ある変数Xが別の変数Yに与える影響がどれくらいか
経済学ではモデル化と実証が目的といいました。それで大事なのは、因果関係です。例えば、所得が上がると貯金が増える。失業者が増えると、犯罪が増える、など。それが本当なら、じゃあ犯罪を抑えるために失業保険を充実させようとなります。
これを見つけることが計量経済学で目的としていることです。つまり、あるデータ(例えば、全国の失業率と犯罪率の5年間のデータ)があるとき、ほかの条件が一定の場合においての正しい因果関係を求めること。
直感的に言うと、失業率が低い場合と、高い場合の犯罪率のデータ群を見て、高い場合の方が犯罪率が高ければ、そこに因果関係があるといえます。
それが「本当」とはどういえるか。これがこの学問で一番重い場所ですね。それをここでは十分性significantといいます。一つの県で失業率が高く、犯罪率も高いとしても、それはたまたまかもしれません。
しかし、大量のランダムに取得したサンプルデータがあり、失業率が高い県をピックアップすると、失業率が低いデータと比べ、全く持ってそれがたまたまといえないくらい違えば、それは本当といえます。
たまたまの割合を棄却率αといい、だいたい5%とかに設定します。計算をしてみて、上記の状況が起こる割合は5%以下だなとわかれば、それは十分に本当と言えるでしょう。これが計量経済学の考え方です。
そして、データからは、だいたいXが1増えると、YはΘ(シータ)増えるな、といったことがわかります。例えば、失業率が1%下がると、犯罪率は0.5%下がるといったことです。これを、データを解釈するinterpretationといいます。そして、この解釈が十分正しいと結論付けるところまでが、計量経済学の仕事です。
まとめと比較
まとめると、経済モデルを実証するため、厳密な因果関係を観察データから導き、政策に応用するための学問。ということ。
逆に言えば、リアルタイムに動く言語化できないようなモデルの構築や、将来の個々人の行動予測や、いつどこで次の地震が起こるかの予測などは目的ではない、ということ。
機械学習などは専門ではないので厳密には語れませんが、目的としては上記の後者のようなことをしていると思いました。
個々人の買い物データをもとに、次に買うおすすめリストを作るプログラムを作成する。とか。これは、まず予測を目的としていますよね。他の例を考えても、機械学習は最終的にどれだけ高精度な予測を、複雑なインプットからアウトプットするか、を目的にしていると思います。それも、その作業は毎回人がやるのではなく、最終的にはプログラムにすることで、何度も違うインプットに対して行うことができる、ということも主軸にあります。扱うインプットも数値データだけでなく、文字や画像ピクセルなど様々ですね。
そのようにプログラムすることで、リアルタイムに実用的な利用をすることができます。例えば、手書きの文字を読み取り、書いてあることを予測するプログラムを作れば、全米の郵便局にて郵便番号を読み取る機械をつくり、配送の手間を大幅に減らすなどの実用化ができます。
このような応用は計量経済学には残念ながらできなさそうです。ロボットにそのようなプログラムを載せることはできますが、計量経済学の結果を伝えても何も起きませんね(笑)。
しかし、仮定の厳密性といったところではきっと役に立つところが多くありそうです。地震の予測などでは、ある要素が次の地震に与える影響がありそうだとわかったとき、機械学習では70%の確率で次に地震がここにあります、というように結論付けます。しかし、では何か施策をしようとなったとき、そのある要素の影響がたまたまなのか、本当に因果関係があるのか、を知るためには計量経済学が役に立ちますね。なぜなら、無駄に貴重なお金と人を使うことはできませんから。
結論
予測とプログラミング、製品化ー>機械学習
経済モデルの実証、施策への応用ー>計量経済学
近年、機械学習が急速に発達しているので、これからだんだんこの2つもくっついていくかもしれませんね。