見出し画像

コスパ最強物件を統計学に基づいて探してみた!(大岡山駅周辺)

物件探しって大変じゃないですか?

新生活を始める際に、賃貸物件を探した経験がある方は多いと思います。できるだけ安く、できるだけ広く、できるだけ駅に近く、できるだけ築浅の物件を探すのに必死になったでしょう。しかし、都会には莫大な数の物件があって、それらを客観的に比較するのは難しいと思います。そこで、統計学の特に重回帰分析という手法を使って、私が在学している東工大の最寄り駅である大岡山駅周辺のコスパ最強物件を探してみました!
エクセルで簡単に行える重回帰分析について、できるだけ簡単に説明しながら、結果を発表していきたいと思います!

*結果だけ確認したい方は、目次から『コスパ最強物件』へ


物件探しに用いたデータ

今回は不動産サイトのSUUMOのデータを抽出して分析を行いました。SUUMOで大岡山駅周辺エリアの賃貸物件を検索し、最寄り駅徒歩10分以内、間取り1DK以内に絞って、2,111件の物件情報を分析データとして用いました。

データの詳細は以下の通りです。

-最寄り駅
・大岡山駅・・・・・・・・・・・・603件
・都立大学駅・・・・・・・・・・・270件
・石川台駅・・・・・・・・・・・・176件
・緑が丘駅・・・・・・・・・・・・153件
・洗足池駅・・・・・・・・・・・・108件
・雪が谷大塚駅・・・・・・・・・・67件
・その他(奥沢駅, 北千束駅など)・・・703件
 
-区
・大田区・・・・・・・・・・・・・1052件
・目黒区・・・・・・・・・・・・・872件
・品川区・・・・・・・・・・・・・126件
・世田谷区・・・・・・・・・・・・61件

なお、SUUMOのwebサイトからデータを抽出する際にスクレイピングという手法を用いるのですが、今回は以下の記事を参考にスクレイピングをさせていただきました。

分析方法

今回は、重回帰分析という分析方法を用いました。重回帰分析を簡単に言うと、複数の要因によって決定される結果について、どの要因がどの程度結果を左右しているのかを明らかにする手法のことです。重回帰分析では、結果のことを『目的変数』、要因のことを『説明変数』と呼びます。今回の分析では、コスパ最強物件を知るために『家賃+管理費』(以下、家賃)を目的変数に用いています。また、家賃を決定づける要因である『築年数』や『面積』を説明変数としています。

分析結果の説明

分析は以下の表のような結果になりました。
この結果の見方について簡単に説明します。

エクセルで重回帰分析を行った結果

まず補正R2は、決定係数と呼ばれる値で値が1に近いほど分析が高精度とされています。一般的に0.8以上であれば精度が良いとされているので、今回は十分高精度でしょう。

次に有意Fという値ですが、これは分析結果が偶然によるものである確率です。一般的には0.05以下であれば意味のある結果とされています。今回は値が小さすぎて0となっているので、かなり有意であると言えます。

次に係数についてです。
まず、18行目から29行目にかけての『アパート』から『石川台駅』までが説明変数と呼ばれる値で、そのそれぞれに係数がついています。各説明変数の値に係数をかけて足し合わせ、切片である3.694879を加えれば、その物件の推定家賃を算出することが出来ます。

各説明変数の値は以下のように決定されます。
『アパート』・・・・アパートなら1, マンションなどなら0を代入
『築年数』・・・・・単純に築年数を代入
『構造』・・・・・・建物が何階建てかを代入
『階数』・・・・・・物件が何階にあるかを代入
『徒歩』・・・・・・最寄り駅までの所要分数を代入
『面積』・・・・・・物件の占有面積(㎡)を代入
『〇〇駅』・・・・・最寄り駅なら1, そうでないなら0を代入

例えば、大岡山駅徒歩5分で築10年の4階建てアパート2階、18㎡の部屋ならば、推定家賃は各説明変数の値と係数の積と切片を足し合わせて、以下の式で計算できます。

3.63-0.29×1-0.072×10+0.12×4+0.19×2+0.017×5+0.23×18+0.27×1
=7.975

つまり、家賃が7.975万円と推定されることが分かります。
(計算の簡略化のために、各係数は切り捨てして有効数字2桁としました。)

次に各説明変数についているt値という値についてです。
これは、各説明変数が目的変数に与える影響の大きさを表しています。t値が正の場合には目的変数を増加させる作用、負の場合には目的変数を減少させる作用が説明変数にあることを示しています。各説明変数をt値の大きい順にすると、以下のようになります。

t値が大きい説明変数

-面積(t=64.2)
-都立大学駅(t=10.6)
-階数(t=9.13)
-構造(t=7.17)
-大岡山駅(t=4.14)
-緑が丘駅(t=2.45)
-徒歩(t=2.23)
--------- t=0 ---------
-洗足池駅(t=-3.87)
-雪が谷大塚駅(t=-4.76)
-アパート(t=-5.30)
-石川台駅(t=-5.36)
-築年数(t=-44.9)

t値が小さい説明変数

この結果を見ると、『面積』が最も家賃を増加させる要因となっていることが分かります。妥当な結果といえるでしょう。

次に最寄り駅に着目すると、『都立大学駅』『大岡山駅』『緑が丘駅』の順に家賃増加要因となっていて、『洗足池駅』『雪が谷大塚駅』『石川台駅』は寧ろ家賃を減少させる要因となっています。やはり、東横線は人気で、池上線はあまり人気がないことがデータから分かりますね。

建物や部屋の階数は、日当たりやセキュリティの観点から、やはり高いほど家賃を増加させることが分かります。

『徒歩』に関しては、今回はデータを徒歩10分圏内に絞ったので、あまり大きな要因とはなっていないようです。寧ろ、最寄り駅から遠いほどやや家賃が上昇する結果となりました。これは、駅に近すぎると走行音の影響で家賃が下がるためだと思われます。

『アパート』に関しては、家賃減少要因となっています。これは、マンションに比べて、構造上の問題で音や振動が伝わりやすいことが原因だと思われます。

重回帰分析を行った結果、以上のような結果が得られました。異なるデータセットを用いて分析すると、また違う結果が得られるかもしれませんね。
交絡因子やダミー変数の設定については、以下のYouTube動画を参考に検討しました。より理解を深めたい方はご覧ください。

コスパ最強物件

いよいよ、この分析結果から得られたコスパ最強物件の発表です。
ここで言うコスパ最強物件とは、重回帰分析によって得られた家賃の予測値と実際の家賃の差が最も大きいものです。

今回のコスパ最強物件は.…


こちら!!!

今回のコスパ最強物件

石川台駅徒歩6分のティーハイム102号室でした~
重回帰分析による推定家賃はなんと10.91万円!!

実際の家賃は7.3万円+4200円の7.72万円なので、推定よりも3万円以上安い計算です。確かに、1DKで35㎡の物件がこの値段は安いかもしれません。
写真を見ると、1階部分は向かい側の建物の陰に隠れて日当たりが悪そうです。これがコスパが良くなった原因かもしれませんね。

ただ、この結果を見てこう思った方もいるのではないでしょうか?

「最寄りが大岡山駅の物件が良い!!!」

そんな方のために、最寄りが大岡山駅の物件の中で最もコスパの良い物件も紹介します。

それがこちら!!!

大岡山駅最寄りのコスパ最強物件

大岡山駅徒歩3分の富士マンション301号室でした~
重回帰分析による推定家賃はなんと10.04万円!!

実際の家賃は管理費0円で7万円なので、こちらも推定より3万円以上安い計算です。築年数はかなり古いですが、立地、面積、階数も良いうえに、南向きなので日当たりも良さそうです。
あまりに安いので事故物件では…?と思い検索しましたが、全くヒットしませんでした。何でこんなにお得なのでしょうか?分かる方がいたら、教えてください!

結論

重回帰分析を用いてコスパ最強物件を探した結果、かなりお得だと思われる物件にたどり着くことが出来ました!
私は来年から社会人になるので、次に引っ越す物件も重回帰分析で探してみたいと思います!

今回は簡単な夏休みの自由研究として、SUUMOのスクレイピングと重回帰分析に挑戦してみましたが、いかがでしたでしょうか??
長い記事となりましたが、ご覧いただきありがとうございました。


コスパ最悪物件を調べた番外編はこちらから!


この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?