【JKI】017_Housing_Market_Madness_02_可視化と道草
【JKI_017】課題を再確認
Just KNIME It! (JKI)
の第17回「住宅市場の狂気」にチャレンジしています。和訳すると語感が強い!
残された課題は以下の3つ。
【課題2:住宅価格変動の地域別比較】解答の可視化まで
この課題はKNIME workflow (WF)を2回に分けて説明しています。
前半分で年次データの算出まではしました。
結果:各地域の毎年の住宅価格の平均が算出されています。
最も劇的な変化をした3つの地域を選ぶにあたって私は下記の通りの方針としました。
A) 欠損値が多く比較しにくい2008年以前のデータは解析対象から除く
B) 直近とはデータが12ヶ月分揃っている2021年を示すと考える
米国全てのデータは課題4で使うので分割しました。また、上記の方針に基づいて2008-2021年のデータを課題2で使います。
Row Splitterノード2つの設定は割愛します。続いて、
GroupByノードでは各地域ごとで2008-2021年の間で最も住宅価格が下がった時と上がった時を抽出しました。「最も劇的な変化をした」ことを「最高値と最低値の比が最も大きい」と解釈しています。下記のように設定して実装しました。
ここは皆さんがどういう手法で判定されるか楽しみです。
設定:
結果:地域名をもともとの並び順に並べ替えて表示しています
ニューヨークとかはもともとの住宅価格が高いでしょうし、比較的変化していないほうに入るでしょう。
ちなみに、どこが一番住宅価格が高いのかは今回聞かれてないんですけど、シリコンバレーの中心都市San Joseでした。
つい道草してしまいましたが、本題に戻ります。
では最も劇的な変化をした3つの地域名を可視化します。
設定:
結果:
すみません、1つも知らない地域たちでした。3倍も住宅価格が変わっては住み替えづらいですね。
センチュリー21の手広い展開に驚きつつ物件を見ましたが、日本の地方都市で賃貸に住む私にはもう全く異世界で実感ができないです。何の平均価格を解析しているんだろかって気分です。
とのことでした。
【課題3:現在平均住宅価格の最も安い州】
上図の通りの処理なので、説明は割愛して設定を以下に。
結果:
驚いた情報はこちら。
さらにこれまた余談で一番高い州はハワイでした。
【課題4:プライムローン危機の可視化】
リーマンショックの可視化とは。多くの方の人生にも影響があった歴史的な出来事であり、なかなか繊細な内容かとは思いますが続けます。
とのコメントでした。何を要求されているのかは実はよくわからないのですが、課題2でデータ前処理したので、そこから米国全体の住宅価格の推移に絞って解答を簡素化してみました。
Scatter Plotでは2000-2022年の住宅価格推移をプロット。
Bar Chartでは前の年と比べて住宅価格が何%変化したかを可視化してみました。
時系列データ処理はまっきーさんの記事を参考にしています。
設定①:Scatter Plot
設定②:Bar Chart表示用WFより
結果:
15年前と現在の価格の動きを比べて、今回のJKIのタイトル「住宅市場の狂気」に納得しました。
WFは既にKNIME Hubに上げています。
おまけ:
【日本のデータを見てみたい】
今回のJKI、解答しながら日本はどうだろうって思いました。
2008-2021年の地域別データなども公開して下さっているサイトがあるようです。
こういう解析をKNIMEでする人と言えばこの方、シャイン社員さん!
ちょっと前は骨折されていたし(この場を借りてお見舞い申し上げます)、今はちょっとお忙しそうでブログの更新が減ってきてますが、住宅価格についても解析して頂けないかなぁ。
記事を読んでいただきありがとうございます。 先人の智慧をお借りしつつ、みなさんに役立つ情報が届けられたらと願っています。 もしサポートいただけるなら、そのお金はKNIMEの無料勉強会の開催資金に充てようと思います。