経済学の実証研究では「能力」をどのように測りますか?
皆さんは、所得のうち、学歴、職歴(年齢)、業種、性別、居住地、それが支払われた年などの、もろもろ所得に影響を与えそうな要因を取り除いたら、何が残ると思いますか?
処世術(上司にゴマをする能力?)、コミュニケーション能力、社交性、プレゼン能力、調整力、交渉力、リーダーシップ、企画発案力、忍耐力、やる気、メンタル、家族構成、好み、運・・・いろいろと考えられます。経済学の実証研究では、この残ったすべてをひっくるめて、「能力」として測ることが多いです。
拙著『ジェンダー格差 実証経済学は何を語るか』で紹介した、議員のクォータ制導入に関する論文の「能力」も、この残ったすべてをひっくるめた部分を「能力」として測っています。
以下は、測れそうにない能力をいったいどのように測っているのか?という経済学を専門にしない方々の素朴な疑問に答えるものなので、内生性などの議論は一切割愛します。
実証研究では、データが入手可能な場合は、IQテストスコアが能力を測る変数として使われてきました。日本でよくいう地頭といったところでしょうか。徴兵制があるような国、少なくとも先進国では、入隊するときにもろもろの検査とともに知能を測るテストを実施していることが多く、その結果が使われたりします。
子どもの「能力」の場合は、同じくIQスコアであったり、単に学力テストスコアであったりします。
おもに労働経済学の分野では、賃金を推定するにあたって、いかに「能力」を測るかという工夫がなされてきました。有名な賃金を決定するミンサー型賃金関数のもっとも基本的なかたちは、
$$
\text{ln}(賃金)=\beta_0+\beta_1 学歴+\beta_2 職歴+\beta_3 職歴^2+\varepsilon
$$
要するに、賃金は、学歴と職歴によって大きく決まるというように表されています。職歴は年齢から教育年数$${+6}$$を引いたものが使われることが多いです。学歴などの前に付いている係数($${\beta_1}$$など)は、就学年数が1年上がると、もしくは高卒から大卒になると賃金にどれほどの変化をもたらすのかを表します。$${\text{ln(賃金)}}$$は賃金の自然対数なので、それぞれの係数を%で解釈することを意味します。たとえば、$${\beta_1=0.1}$$であれば、大卒賃金は高卒賃金に比較して、平均して10%高いという推定です。最後の$${\varepsilon}$$が、学歴、職歴では説明できない賃金を決定する要因をすべて含んでいます。
この基本形に、性別や能力、業種、居住地、賃金が支払われた年などのデータがあれば、
$$
\begin{array}{}\text{ln}(賃金) &=&\beta_0+\beta_1 学歴+\beta_2 職歴+\beta_3 職歴^2+\beta_4 性別+\beta_5 能力\\&+&業種による影響+居住地による影響\\&+&支払い年による影響+\varepsilon\end{array}
$$
という拡張バージョンの推定ができます。たとえば、$${β_4}$$は性別によって賃金が何%違うのかを推定しています。業種、居住地、支払い年に係数がついていないのは、たまたまこの式では、業種などの違いによる賃金水準の違い自体に興味があるわけではなく、業種や居住地が賃金にもたらす影響を排除したいことを意味しています。たとえば、金融セクターと教育セクターの賃金水準の違い自体に興味はないけれど、金融セクターの高い賃金水準の影響を除きたいなどです。この拡張バージョンでは、最後の$${\varepsilon}$$の解釈がもっと限定されます。つまり、学歴、職歴、性別、能力、業種、居住地、支払い年では説明できない賃金を決定する要因をすべて含んでいます。
この推定式がどれだけ賃金を説明するかは、国や地域によっても異なるでしょう。日本のような年功序列の賃金体系が強い国では、職歴(年齢)の説明力が大きそうです。また日本の場合は、正規雇用かどうかや企業規模を入れるとさらに正確に推定できるでしょう。
ここで最初の質問、能力をどのように測るのか?に戻ります。賃金関数の能力には、データがありさえすればIQテストスコアが使われることが多いように思います。ではIQスコアなどがない場合はどうなるか?ない場合は、IQ含め最後の$${\varepsilon}$$に含まれることになります。
$$
\begin{array}{}\text{ln}(賃金) &=&\beta_0+\beta_1 学歴+\beta_2 職歴+\beta_3 職歴^2+\beta_4 性別\\&+&業種による影響+居住地による影響\\&+&支払い年による影響+\varepsilon\end{array}
$$
この式では、最後の$${\varepsilon}$$は学歴、職歴、性別、業種、居住地、支払い年(インフレや景気等)の影響を除いた、賃金を説明する要因すべてを表します。IQ(知能)、処世術、コミュニケーション能力、社交性、プレゼン能力、調整力、交渉力、リーダーシップ、企画発案力、忍耐力、やる気、メンタル、家族構成、好み、運などなど、すべてです。
ベズリーたちの論文でいう「能力」は、IQ以下これらすべてを含んでいます。彼らの被説明変数は可処分所得を使っています。よって彼らの論文でいう「能力」の定義は、所得ではなく、学歴、職歴(年齢)、業種、居住地などの影響を取り除いた、所得を説明するそのほかの要因です。
以下では、もっと知りたい方向けに、ベズリーたちの論文で使われた「能力」指標についてさらに詳しく説明します。
この論文では、まず、所得を説明する要因のうち、学歴、職歴(年齢)、業種、居住地、支払い年の情報を取り除いた$${\varepsilon}$$を推定します。政治家になった後の所得への影響を取り除くため、政治家になる前の所得データのみを使用しています。性別の違い、退職後の違いを取り除くため、男性と女性、また65歳以上の人たちは別々に推定しています。
このように推定した$${\varepsilon}$$を、学歴、職歴、業種、性別、居住地、支払い年の影響を除いた所得を説明する包括的「能力」とし、各党ごとに平準化したのちに、上半分を「能力」が高い、下半分を「能力」が低いとし、この二値変数を能力の変数として使っています。二値変数とした理由は、たとえば金融セクターのCEOといった、ものすごい高い給料をもらっていそうな人たちの影響を取り除くためだそうです。各党ごとに平準化しているのは、党ごとにどういった社会階層から候補者を選ぶのか、といったことが違うので、その影響を排除するためです。要するに平準化された$${\varepsilon}$$が各党のなかで高いのか低いのか、単純にどちら側にいるのかを表す変数なので、平均すればたしかに能力の違いを説明できそうな気がします。
この論文では、労働市場での稼ぐ能力ではなく、政治家としての能力が問題となっているので、この二値変数と知能やリーダーシップ能力との整合性や、それが政治家としての能力を確かに表しているか、政治的な能力の代理変数として使用することの妥当性を検証しています。
具体的に、男性に限っては、徴兵の際の知能テストや非認知テストとの整合性が確認できます。認知テストはいわゆるIQテスト、非認知テストは、リーダとして重要な、ストレス耐性、協調性、責任感、率先力などを測る心理学のテストです。この$${\varepsilon}$$をもとにした二値変数と知能および非認知テストスコアは、確かに相関しています。
また、この二値変数が、政治家としての成功度や政策の成功度を説明することも確認しています。政治家としての成功度は、得票率、再選率、名簿の順位などで測っています。政策の成功度は、選挙区における有権者の満足度もしくはクレーム、財政の健全度などで測っています。
このように経済学では、測れそうもないものを測るために涙ぐましい努力をしています。もちろん、これがパーフェクトな測り方ではなく、日々研究者がより良い測り方を工夫しています。どんな工夫をしているのか、調べてみるのも面白いですよ。
ベズリーたちの元論文はこちらから↓