見出し画像

【改訂グラフ入り】成田悠輔の論文が10分で読める! / 文章で重回帰

10分は言いすぎかな。

まず、30人の男子のクラスを想定してください。

相撲のつよさをロボット相手に計りました。

身長と体重を説明変数にしたいと、仮定します。

被説明変数が相撲の強さです。

総当たり戦やトーナメントにすると、またやっかいな統計処理がいるので、相撲ロボット相手に、「何点」と、スコアがでるとします。

S = a X + b Y + e

LaTeX、というかっこよく数式を書ける機能もあるのですが、平打ちします。

S が相撲の強さ、既知です。ロボットとの対戦スコアです。
X 身長、既知です。
Y 体重、既知です。

e の誤差項は無視していいです。

なが知りたいか。

a と b です。
身長と、体重の、係数です。
身長が1CM伸びたら、相撲はどれだけ強くなるのか。
体重が1KG重くなったら、相撲はどれだけ強くなるのか。

これが係数です。

どうやって計算するのか。

最小二乗法。

30本の式を用意するんです。

つまり、a 1 X 1 + b 1 Y 1 から、ずーっと、
              a 30 X 30 + b 30 Y 30 まで。

その、30本の式が空に浮かんでいると想像してください。

そいつらを、えいやっと、つかまえて、1ぽんの式にしたのが、「重回帰」分析の2つ説明変数を使ったバージョンです。

成田悠輔の研究

なぜ彼の研究が評価されているのかは、その説明変数の多さと制御です。
有名なコロナ死者数にアメリカ政府の補助金は役に立たず、病院を潤わせただけだったという論文では、左辺はコロナ死者でしょう。
右辺に2桁の説明変数が入っているそうですよ。

目の色までコントロールしていたとのことです。
当然、人種や住んでいる地域も入っているでしょう。
良い論文は読まなくても内容が漏れ伝わってきますね。

なにがすごいのか

説明変数がふえると、それだけ説明変数どうしに相関が生まれる可能性がでてきます。
マルチコリニアリティといって、多重共線性。

和製略語で「マルチコが」なんてつかいます。

こいつが説明変数がふえるほど、わるさをして、「見かけの説明力」だけ上げてしまうんですね。

ふつうの経済学の論文では、3つか4つですよ。

2桁。

私が成田の論文を読まないのは、論文の構造は分かるでしょうけれど、たぶん全般的な理解はできないから。

だいいち、くやしいし。

私は「ナニモノ」かになりたい。

この世に生まれて、なにも残さないのはイヤ。

ここまで読まれたら、成田の論文を読んでみたらいかがでしょう。
インターネット上に公開しているかもしれません。
なければ、そのほうが良いのですが、お近くの大学図書館へお散歩がてら行ってみてはどうでしょう。

ただこのご時世、外部の利用可かと、コピーが取れるかは聞いておいたほうがいいです。
なるべく遠くても大きな大学から電話してください。
小さくてもコピー可ならそっち優先で。

学食安いんでお腹すかせて行ったほうが。
とくに国立大学、県立、公立。
どうどうと、たべましょう。
私立だって、助成金もらっているんだ。
レストランだと思えばいいわ。

あ、大学の代表に電話おかけになったあと、大学図書館の司書さんに替わるとおもうけれど、つっけんどんだったら、ゴメンナサイ。

ワタシが先にここであやまっておきます。
彼女たち、疲れているんです。

ついこのまえまでコーコーセーだったくちばしの黄色いガキどもがぴよぴよぴよぴよ。

院生や、ポスドクは基本的に3階より下には降りて来ないし、自分のことは自分でやる。
1階と2階が1、2年生を中心とした社交場となっているの。

いいですか、

S = a X + b Y + e

S が相撲の強さ、既知です。ロボットとの対戦スコアですよ〜。
X と Y は30人の身長、体重、既知ですね~。

a 身長が1CM伸びたら、相撲はどれだけ強くなるのか?
b 体重が1KG重くなったら、相撲はどれだけ強くなるのか?

これが係数です。これが知りたかったの。

最小二乗法は、身長と体重を X と Y のどちららかに振りわけて、散布図にプロットします。
そうすると、最適な直線が引けます。
その直線が「回帰式」なのです。

最小二乗法という名前は、回帰式より下にプロットされた、背の低い、体重の軽い生徒は、そのまま計算したらプラスマイナスでゼロになってしまうから。

経済やファイナンスでは、とりあえず二乗してみる、というのは基本です。

二乗すれば、マイナスもきちんと計算できますので。

すべてのプロット、30人の生徒のデータ、身長と体重を2次元に置いてみる。

それらのデータがもっとも、適当な直線を引きます。

それが、「回帰式」です。

イメージです

モバイルで Excel を使うのがきついので、イメージだけ生成AI で出しました。

点々が学生です。
30人以上いますけれど、スルーで。
3次元ですが、横から見て、2次元にしてください。
曲線も直線でお願いします。

バラついた学生たちを、もっとも、適した線にするんです。

どうやるか。

小さな三角形をたくさん作るんです。
一人ひとりから、直線へ、もっとも小さな三角形を作っていく。
でも、直線の下や、上でも、マイナスが出ちゃう。
だから二乗して計算するの。
それで、「最小二乗法」

ほぇー、改訂しました。
これで分かりやすくなりましたか?
どうでしょう。

いいなと思ったら応援しよう!