【研究紹介】計量経済学でM-1グランプリを見る
皆さんこんにちは。M-1グランプリのエントリーが始まりましたね。僕はお笑いがかなり好きで、もちろんM-1も欠かさず見ています。Netflixで何周も見返すので、ネタの一部を言われたら何年のどのコンビか当てられます。
ところで、どうしたらM-1で良い順位がもらえるのでしょうか?なんとなく吉本興業の芸人が勝っているイメージがありますが、偶然でしょうか?なんとなく芸歴が長い芸人が有利なイメージがありますが、本当でしょうか?このように、複数の要素の関係について、因果関係を特定する方法があります。それが、計量経済学です。非常に難解で、僕自身よくわかっていないので、中学校の数学の知識まででわかるように説明したいと思います。
【ちょっと脱線】
因果関係と似た概念として相関関係があり、よく混同されます。両者には大きな違いがあるので、先に説明しておきます。因果関係とは、「Aの変化が原因となってBの変化が起きる関係」です。例えば、一般に気温の低下が原因となっておでんの売上が向上することが知られています。一方で相関関係とは、「Aの変化とBの変化が関係しあっている」ということです。例えば、数学の点数が高い子どもは理科の点数も高いでしょう。しかし、数学の点数の向上が原因で理科の点数が上がるかというと、そんなことはないでしょう。これが因果関係と相関関係の違いです。
中学数学の復習
さて、いきなり数学の話で恐縮ですが、1次関数って覚えていますか?y=ax+bとか言われてたヤツです。ここで、1個200円のりんごを買うことを考えます。購入するりんごの個数をx個とすると、合計金額y円について、
y = 200x ・・・①
という式で表せます。例えばりんごを5個買うとしたら、合計金額は200×5=1,000円です。10個であれば2,000円、15個であれば3,000円です。
また、1個500円のりんごについては、
y = 500x・・・②
という式で表せます。こちらも、りんごを5個買うとしたら2,500円、10個であれば5,000円、15個であれば7,500円です。当然、同じ個数を買うのであれば、②式の方が金額は高くなります。合計金額や個数はいくらでも変わる値で(これを変数と言います)、りんご1個の値段は定まっています(これを定数と言います)。
そして、xを変えると、それが原因となってyも変わっていきます。どれくらい変わるか、つまり、因果関係の強さを表しているのが定数です。具体的には、今回の場合では①②式それぞれについて、「りんごの個数xを1増やすと、合計金額yは200円増える・・・①」「りんごの個数xを1増やすと、合計金額yは500円増える・・・②」と言うことができます。
ここで、発想を逆転させてみます。りんごの例では、定数が既にわかっていましたが、未知の定数を推測してみましょう。ここで、11歳の日本人男子とその父親を100ペア集めて身長を測るとします。例えばA君の身長は140cmで、その父親175cm、B君の身長は130cmでその父親は162cmという具合です。さて、子どもの身長をy[cm]、その父親の身長をx[cm]としたとき、yはどのような式で表せるでしょうか。
y = 0.8x・・・③
こんな式で表せたとします。もしこの式について、計量経済学の手続きに従って正当性を示せたとすると、父親の身長が1[cm]高いと、息子の11歳時点での身長y[cm]は0.8だけ高くなるという因果関係が期待できると言えます。りんごの例と同じように、0.8という定数が、2つの要素の因果関係の強さを示しています。父親の身長をぐいっと伸ばしたりはできないので、因果関係ではないじゃないか!と言いたくなりますが、「ある子どもが今の父親よりも1cm背の高い父親の遺伝子を持っていたら、その子どもの身長は今よりも0.8cm高かったはずだ。」と言い換えると、因果関係感(?)が伝わるかと思います。
M-1グランプリの分析
さて、ようやく本題に入ります。③式と同じ方法で、M-1グランプリの順位について、芸歴〇年という要素、吉本興業に所属しているという要素がどのような因果関係を持っているのか(もしくは持っていないのか)考えてみましょう。上記だけでは説明できない考え方も含まれますが、とにかく、定数が因果関係の強さを示すということだけ覚えておいてください。
今回使う式は以下です。
順位スコア = α1 × 芸歴 + α2 × 吉本所属かどうか・・・④
注目してほしい点は3つです。
・順位スコア
順位が高いほど数字が低くなってしまうので、順位スコア = 11 - 順位として計算しています。
・α1 × 芸歴
芸歴が1年長くなると、順位スコアがα1ポイント上がる(=順位がα1ポイント上がる)ということです。
・α2 × 吉本所属かどうか
吉本に所属していると、順位スコアがα2ポイント上がる(=順位がα2ポイント上がる)ということです。数字で表せない要素も、0と1を使って表せます。複雑なのでここでは割愛します。(気になる方は”ダミー変数”でググってみてください)
統計ソフトで、M-1グランプリ決勝戦2015-2021について分析した結果が以下です。
統計ソフトが出した答えは。。。
”Coefficient”と書いてある列の、"geireki""yoshimoto"の行を見てください。"geireki"と書いてある行にα1が、"yoshimoto"と書いてある行にα2が表示されています。つまり、M-1の順位は、芸歴が1年長くなるとおよそ0.166高くなり、吉本に所属しているとおよそ1.91高くなると言えます。
結果の解釈
皆さんはこの結果についてどう思いますか?個人的には、ある程度直感的な結果が得られたと思いますが、芸歴がさほど順位に影響しないことは意外でした。ただ、2018年霜降り明星(芸歴5年目で1位)や2020年おいでやすこが(芸歴1年目で2位)のような、超レアケース(外れ値と言います)によって芸歴の影響が薄められていると思います。こうしたケースを除いて分析してみると、もう少し芸歴の影響が顕著になるでしょう。
今回はデータの準備がめんどくさかったので、2015年以降で分析しましたが、初代M-1からまとめて分析しても面白いかもしれません。ますだおかだ(松竹芸能)やアンタッチャブル(人力舎)など、非吉本芸人の優勝があるので、違った結果が得られるはずです。また、順位に影響する変数として、これまでの表彰歴や関東出身/関西出身なども考えられます。有効な変数は全ていれるべきなので、もう少しこのテーマで分析を続けてみたいですね。
今日は計量経済学の紹介になれば、と思いこの記事を書きました。僕自身、進学してからこの分野の勉強をしているので、まだ3か月程度の経験しかありません。それでも、正しい手順を踏めば、世の中に隠れる因果関係がわかるという強烈な分野なので、とても魅力的に感じています。少しでもこの魅力が読んでいる方に伝わっていますように。。。!