大学進学者数の重力モデルの改良版
東京一工・地帝・早慶への都道府県別の進学者数について、重力モデルを適用する分析を以前に行いました。その結果、対象大学への都道府県別進学者数には重力モデルが適用できることがわかりました。別の表現をすると、「対象大学への都道府県別進学者数は、大学の募集人数と都道府県の高3生徒数に比例し、大学と都道府県の距離に反比例する」と言えることがわかりました。
前回は、ここに入試偏差値などの説明変数を追加して、相関が高まるかを精査しています。今回は別の説明変数を追加して、更に相関が高まるか見ていきます。
重力モデルや変数は説明を省略しますので、前回の記事をご覧下さい。
なお、入試偏差値は前回の分析では、対象大学の学部学科の単純平均を採用していました。今回は定員の加重平均値を算定でき、加重平均値の方がその大学の学生の平均学力に近いため、入試偏差値は単純平均から加重平均に置き換えます。ただし、この変更による重回帰結果への影響は軽微(補正R2でマイナス0.003程度)のため、前回記事の修正は行いません。
0. まとめ
東京一工・地帝・早慶の都道府県別の進学者数は、大学の募集人数と都道府県の高3生徒数に比例し、大学と都道府県の距離に反比例した上で、入試偏差値と出身都道府県の高3生徒数増減率に比例し、大学所在値の高3生徒数増減率に反比例する(補正R2:0.7497、全ての変数のP-値は1%未満)。
また、大学所在値の家賃との負の相関も確認でき、家賃の高いエリアの大学への進学者数は抑制されていると言える。ただし、高3生徒増減率と家賃の2つの説明変数を同時に追加すると、家賃の相関は確認できなくなった。大学所在値の家賃は進学者数に負の影響を与えるが、高3生徒増減率と比べると軽微な影響で無視してよいと考えられる。
このことから、大都市(人口増)から地方(人口減)の相対的に入試偏差値の低い大学に、学力優秀層が移動していると考えられる。
1. 前回のおさらい
前回は、東京一工・地帝・早慶の都道府県別の進学者数に重力モデルが基本的に成立し、更に入試偏差値を説明変数に追加すると決定係数が上昇することを確認しました。
上段が大学の募集人数、都道府県の高3生徒数、都道府県庁の距離の3つの説明変数の基本モデルの重回帰分析の結果です。下段はそれに、入試偏差値を追加したものです。今回は下段の4つの説明変数のモデルに、さらに説明変数を追加していきます。
2. 説明変数の追加
追加する説明変数は次の2種類の4変数です。高3生徒数増減率は、Xにポストした先のコメントでヒントをもらっています。
大学所在地の家賃
出身都道府県の家賃
大学所在値の家賃が出身都道府県の家賃より相対的に安ければ、進学者数が増えるという仮説から追加しています。家賃は全国賃貸管理ビジネス協会の8月調査結果を引用しています。
https://www.pbn.jp/yachin/大学所在地の高3生徒数増減率
出身都道府県の高3生徒増減率
大学所在地の高3生徒数が減少していれば、他の都道府県からの流入が増えるという仮説から追加しました。増減率は2014年から2024年の10年間の差分で、文部科学省の統計から計算しています。期間を10年間にしたのは、この期間の大学定員の減少が軽微であることを確認できており、独立した変数として扱えると考えたためです(20年前の定員データは入手できなかった)。
①家賃を追加した重回帰分析
まずは、家賃の2つの説明変数を追加してみます。重回帰分の結果はこのようになりました。
補正R2は0.7230と、追加前(表2)より0.02上昇していて、いい感じです。ただ、追加した2つの家賃の変数の内、大学所在値の家賃(X5)は負の相関が確認できますが(P-値:0.01%未満)、出身都道府県の家賃(X6)はほぼ相関がないようです(P-値:67%)。遠方の大学に進学を検討する際に、大学所在値の家賃は判断に影響するようですが、地元で一人暮らしするわけではないので、地元の家賃は影響しないようです。
②高3生徒数増減率の追加
次に家賃の2つの説明変数を除いて、元の4つの説明変数のモデルに高3生徒数増減率の2つの説明変数をしてみます。重回帰分の結果はこのようになりました。
補正R2は0.7497と、追加前(表2)より0.045も上昇していて、更にいい感じです。そして、追加した2つの説明変数の高3生徒数増減(X5・X6)は、どちらもP-値が0.01%未満で相関が確認できます。
大学所在値の高3増減(X5)は負の相関なので、人口が増えているエリアの大学への進学数は小さく、人口が減っているエリアの大学には進学数が大きくなります。逆に、出身都道府県の高3増減(X6)は正の相関なので、人口が増えている都道府県からの進学者数は大きく、減っている都道府県から進学者数が小さくなります。
この2つの変数をまとめて見ると、人口の増えている都道府県から人口の減っている都道府県の大学への進学者数が大きくなる、ということになります。端的な例としては、東京から地方帝国大学への進学者数の方が、地方から東大・一橋大・東工大・早稲田大・慶應大への進学者数よりも、相対的に多いと言えます。
③家賃と高3生徒数増減率の追加
最後に家賃と高3生徒数増減率の4つの説明変数を全て加えてみます。検討の流れで、②のモデルに家賃の説明変数2つを追加した形で、重回帰分析を行います。結果はこうなりました。
残念ながら、補正R2(0.7489)は高3生徒数増減率だけを追加した表4の補正R2(0.7497)よりわずかに下がってしまいました。
変数を個別に見ると、最初の4変数と高3生徒数増減の2変数はP-値が5%未満で、ほぼ変わらない相関が確認できます。一方、家賃の説明変数(X7・X8)はP値が極めて高く、相関が確認できません。単独で家賃だけを追加した際には、大学所在値の家賃(X7、表3ではX5)は負の相関が確認できたのですが、高3生徒数と複合すると、相関が確認できなくなっています。
重回帰で見る場合には、家賃の相関はその他の変数よりも弱く、全体への影響が軽微となるようです。そのため、家賃と高3生徒数増減の2種類4つの説明変数を追加するよりも、高3生徒数増減の2つの説明変数だけを追加した②のモデルの方を採用することとします。
3. 最後に
今回の考察の結果、東京一工・地帝・早慶の都道府県別の進学者数は、大学の募集人数と都道府県の高3生徒数に比例し、大学と都道府県の距離に反比例した上で、入試偏差値と出身都道府県の高3生徒数増減率に比例し、大学所在値の高3生徒数増減率に反比例する(補正R2:0.7497、全ての変数のP-値は1%未満)ことがわかりました。
再掲すると重回帰モデルはこの表のようになります。
このモデルを使えば、前回の最後に疑問点としてあげた愛知県から東北大への進学者(55名)と宮城県から名古屋大へ進学者(4名)のアンバランスも説明ができます。入試偏差値がほぼ同等の2つの大学の間(例:名古屋大と東北大)であれば、相対的に人口増の愛知県(91%)から相対的に人口減の宮城県(88%)の東北大に、逆方向(宮城から名古屋大)よりも多くの学生が進学することになります。
しかし、改めて表4を見ると、大学の入試偏差値の係数がプラスの値(1.6152)です。この係数は高3生徒数増減を追加する前の表2ではマイナスの値(-0.8897)でした。なぜ逆転したのかは理由は解き明かせていません。
少し気持ち悪さは残りますが、重力モデルはある程度できたということで、次回は重力モデルの下での大学ごとの特性を見て、全国区での大学の人気・魅力を定量的に分析したいと思います。