![見出し画像](https://assets.st-note.com/production/uploads/images/153117319/rectangle_large_type_2_1d709091dd9c434d1e0158d1ac834f1c.jpeg?width=1200)
【改訂グラフ入り】成田悠輔の論文が10分で読める! / 文章で重回帰
10分は言いすぎかな。
まず、30人の男子のクラスを想定してください。
相撲のつよさをロボット相手に計りました。
身長と体重を説明変数にしたいと、仮定します。
被説明変数が相撲の強さです。
総当たり戦やトーナメントにすると、またやっかいな統計処理がいるので、相撲ロボット相手に、「何点」と、スコアがでるとします。
S = a X + b Y + e
LaTeX、というかっこよく数式を書ける機能もあるのですが、平打ちします。
S が相撲の強さ、既知です。ロボットとの対戦スコアです。
X 身長、既知です。
Y 体重、既知です。
e の誤差項は無視していいです。
なが知りたいか。
a と b です。
身長と、体重の、係数です。
身長が1CM伸びたら、相撲はどれだけ強くなるのか。
体重が1KG重くなったら、相撲はどれだけ強くなるのか。
これが係数です。
どうやって計算するのか。
最小二乗法。
30本の式を用意するんです。
つまり、a 1 X 1 + b 1 Y 1 から、ずーっと、
a 30 X 30 + b 30 Y 30 まで。
その、30本の式が空に浮かんでいると想像してください。
そいつらを、えいやっと、つかまえて、1ぽんの式にしたのが、「重回帰」分析の2つ説明変数を使ったバージョンです。
成田悠輔の研究
なぜ彼の研究が評価されているのかは、その説明変数の多さと制御です。
有名なコロナ死者数にアメリカ政府の補助金は役に立たず、病院を潤わせただけだったという論文では、左辺はコロナ死者でしょう。
右辺に2桁の説明変数が入っているそうですよ。
目の色までコントロールしていたとのことです。
当然、人種や住んでいる地域も入っているでしょう。
良い論文は読まなくても内容が漏れ伝わってきますね。
なにがすごいのか
説明変数がふえると、それだけ説明変数どうしに相関が生まれる可能性がでてきます。
マルチコリニアリティといって、多重共線性。
和製略語で「マルチコが」なんてつかいます。
こいつが説明変数がふえるほど、わるさをして、「見かけの説明力」だけ上げてしまうんですね。
ふつうの経済学の論文では、3つか4つですよ。
2桁。
私が成田の論文を読まないのは、論文の構造は分かるでしょうけれど、たぶん全般的な理解はできないから。
だいいち、くやしいし。
私は「ナニモノ」かになりたい。
この世に生まれて、なにも残さないのはイヤ。
ここまで読まれたら、成田の論文を読んでみたらいかがでしょう。
インターネット上に公開しているかもしれません。
なければ、そのほうが良いのですが、お近くの大学図書館へお散歩がてら行ってみてはどうでしょう。
ただこのご時世、外部の利用可かと、コピーが取れるかは聞いておいたほうがいいです。
なるべく遠くても大きな大学から電話してください。
小さくてもコピー可ならそっち優先で。
学食安いんでお腹すかせて行ったほうが。
とくに国立大学、県立、公立。
どうどうと、たべましょう。
私立だって、助成金もらっているんだ。
レストランだと思えばいいわ。
あ、大学の代表に電話おかけになったあと、大学図書館の司書さんに替わるとおもうけれど、つっけんどんだったら、ゴメンナサイ。
ワタシが先にここであやまっておきます。
彼女たち、疲れているんです。
ついこのまえまでコーコーセーだったくちばしの黄色いガキどもがぴよぴよぴよぴよ。
院生や、ポスドクは基本的に3階より下には降りて来ないし、自分のことは自分でやる。
1階と2階が1、2年生を中心とした社交場となっているの。
いいですか、
S = a X + b Y + e
S が相撲の強さ、既知です。ロボットとの対戦スコアですよ〜。
X と Y は30人の身長、体重、既知ですね~。
a 身長が1CM伸びたら、相撲はどれだけ強くなるのか?
b 体重が1KG重くなったら、相撲はどれだけ強くなるのか?
これが係数です。これが知りたかったの。
最小二乗法は、身長と体重を X と Y のどちららかに振りわけて、散布図にプロットします。
そうすると、最適な直線が引けます。
その直線が「回帰式」なのです。
最小二乗法という名前は、回帰式より下にプロットされた、背の低い、体重の軽い生徒は、そのまま計算したらプラスマイナスでゼロになってしまうから。
経済やファイナンスでは、とりあえず二乗してみる、というのは基本です。
二乗すれば、マイナスもきちんと計算できますので。
すべてのプロット、30人の生徒のデータ、身長と体重を2次元に置いてみる。
それらのデータがもっとも、適当な直線を引きます。
それが、「回帰式」です。
![](https://assets.st-note.com/img/1725434473-HYFpVn5XIJ2EUQLgSWBv63ul.jpg?width=1200)
モバイルで Excel を使うのがきついので、イメージだけ生成AI で出しました。
点々が学生です。
30人以上いますけれど、スルーで。
3次元ですが、横から見て、2次元にしてください。
曲線も直線でお願いします。
バラついた学生たちを、もっとも、適した線にするんです。
どうやるか。
小さな三角形をたくさん作るんです。
一人ひとりから、直線へ、もっとも小さな三角形を作っていく。
でも、直線の下や、上でも、マイナスが出ちゃう。
だから二乗して計算するの。
それで、「最小二乗法」
ほぇー、改訂しました。
これで分かりやすくなりましたか?
どうでしょう。