ジムニー/シエラでお得車両を見つける。
ジムニーシエラはまだ人気?
ジムニーシエラの購入して約1年経過。いまだに中古車価格が高値を維持しているようです。当時も14ヶ月待っての納車でしたが、現在も納期かかるんでしょうか。今回はジムニーとジムニーシエラの中古車価格分布についてみてみます。
データ収集について
価格comさんのデータ参照。
データ収集後は以下と同様に、多変量回帰分析により、車両価格を予測するモデルを構築。データの欠損値は平均値で補完。データモデルについては
K-Foldクロスバリデーションを用いて評価しています。
価格が様々な特徴量(走行距離、エアロパーツ有無、修復歴、新車価格、年式、ミッション種類、カラー、グレード名)によってどのように影響するかを確認、構築モデルより”予測価格”を算出。
その予測価格と実際価格の差分を”difference”として算出します。
価格収集
データモデルによる予測価格算出
(予測価格)-(実際価格)による差異計算
今回はジムニー/ジムニーシエラ、グレード問わずお得な車両を抽出できないかを目的にしていますが、それぞれ新車価格が違うので先ほどの差異
”difference"を等価評価するために、正規化を行なっています。
# 差分の計算
df['difference'] = df['価格'] - df['新車価格']
# Zスコアの計算
df['z_score'] = stats.zscore(df['difference'])
# Zスコアが一定の閾値を超える場合に異常と判断(例えば、2.5を超える場合)
df['anomaly'] = df['z_score'].abs() > 2.5
ここでz-スコアは各データポイントの標準偏差からの偏差を計算し、一定の閾値を超えるものを異常(お得)とみなします。
残価率10ヶ月の変化
異常検出の前に、ここ10ヶ月の市場状況を見ておきます。
ジムニーとジムニーシエラの残価率(市場価格/新車価格)の時系列変化を散布図で表記。プロットの大きさは市場の流通台数を表しています。ここ10ヶ月で全体的に0.1(大凡20万円)ほど低下していますね。ですがまだまだ残価率1を超える珍しい車両です。
2018から2024年式のものを一括りで傾向把握していますが、各年式別の2024/6時点の残価率分布も確認しておきます。この車はカスタム車両が高額で取引されており、市場全体の価格を引き上げる要因になっているようです。
お得車両の抽出
さて、市場傾向を把握したので個別に割安車両をピックします。
先ほどのグラフで各年度のパーセンタイルは確認できるし異常値もプロットにダイレクトリンク貼っているので、直接確認できるじゃないかとも思いますが、ここまでやったので、やはりpython使って出力します。💪
価格と”z_score”で散布図作成。プラス側を削除して拡大したものです。
zスコアが-4の確率は約0.0032%なので、相当な異常値かと思います。
ジムニーシエラのMT車ですが、かなりお得車両! だと思います。
まだまだ中古車市場でも高値ですので、転売すれば益が出そうですね。
といっても新車より少し安い程度ですが。
今回ジムニーで紹介しましたが、このアイデアを使って複数メーカーから一気に抽出するプログラムも作成しましたので、また紹介していきます。