- 運営しているクリエイター
#プログラミング学習
100日後にプロになるワシ20日目(Python)
前回。引っ越し数を予測する機械学習モデルを作成するも、結果ダメダメだったので、また別の機械学習の勉強を始めることにしました。
今回は「賃貸物件の家賃推定」
データはこんな感じ↓
カラム名 説明id 物件ID家賃 家賃(目的変数)所在地 住所アクセス 最寄りの路線等間取り 間取り築年数 築年数方角 方角面積 面積所在階 物件自体の階数と物件がある建物の総階数バス・トイレ バス・トイレの建てつけ等
100日後にプロになるワシ19日目(python)
前回の続き。
結局時系列データにしないといけなかったので
datetimeを変形して週のデータに変更。
weekNumとして列に追加した。
ただ、1年間は52週あるのでfor文で対応
んで、
データがweekNumだけfloat型なのが気に入らないので型変換
ここでようやくデータ準備OK!!
学習用データと答えデータに分ける
今回は未来予測なので多分線形回帰がモデルとしてあってる。
と信
100日後にプロになるワシ18日目(Python)
今日のまとめやらかした!
けど一応時系列的にやっていく
まずは昨日の続きから
月で計算するよりも週で計測するといい感じなると思ったので
第何週ではどれだけの数引っ越しされたのかを算出しようとした
こんな感じで第0週と引っ越し回数の頻度対照表を作成
1年で54週あるのでそれをループして作成し。
横に連結させる
こんな感じ。
んでそれにラベルをつけて・・・
なかなかそれっぽい
これで
100日でプロになるワシ17日目(python)
昨日に引き続きデータ作成。
昨日は曜日ごとの引っ越し回数を抽出したのでそれをまとめます
weekの列が曜日を表しています↑
月曜から日曜日までの引っ越し回数との関係を抽出↑
連結して↑
ラベルを付与↑
曜日との関係データとしてこれで一旦OK
次は月別!と思ったんですが、3年分くらいデータがあるので
年の初めからの週をカウントしようかと思います
1年は52週!↑
諸事情あって今日は
100日後にプロになるワシ16日目(Python)
今回は機械学習をさせるための学習データと解答データを作成する
説明変数と目的変数機械学習では学習データを説明変数。解答データを目的変数という。
今回は全データを半分半分にして前半を説明変数。
後半を目的変数として扱う。
前回作成したデータを使う
データを半々で分ける
特徴量について特徴量とは簡単にいうと答えを導くための学習のとっかかりです。
今回で言えば引っ越し回数に影響しそうな数値の
100日後にプロになるワシ15日目(Python)
今日は前回の続き。
前回は機械学習を始めるために環境構築とデータのダウンロード
データの確認まで行いました。
今日はデータの分析を行なっていきます。
参考(https://signate.jp/competitions/269/data)
データにはたまに欠損と言って値が入ってなかったりします。
今回はあらかじめデータの欠損があることがわかっていたので
まずはデータの欠損がどれくらいあるか調