
ビジュアライズの方法論
今回はNFT全く関係ありません。一昨日、こんなツイートをしたら思ったより多くの人に見ていただけました。
ノーコードで作った港区中古マンションの坪単価です pic.twitter.com/BFEPfvyE6B
— 花村 直親 Nao Hanamura (@naomasabit) June 6, 2021
noteの深津さんまで見ていただけました。
新しいマンションは坪単価が高く、価値評価がブレて見積もりにくい。古いマンションは坪単価が低く価値評価が収束しやすい? https://t.co/plOQOQJOIl
— 深津 貴之 / THE GUILD / note (@fladdict) June 6, 2021
これは「港区」の「中古マンション」の「坪単価」という気になる情報について、情報を圧縮して一枚の画像に納められたことからかと思います。
データビジュアライズの力はとても大きいものです。「NFTを分析するマガジン」でも、NFTのデータを見るにあたって、様々な形でビジュアライズをしてきました。
NFTライブコマースのAuctionityではどのような取引が行われているのか? より
クリプトスペルズはOpenSeaでどの程度取引されてるのか? より
NFTのような定性的なものを表現するためにビジュアルで様々工夫しています。今回はビジュアルを作る時に工夫していることを、港区の中古マンションデータ画像を例に考えてみます。
比較しやすい条件でデータをまとめる
実は、件のツイートよりも前に複数区についてビジュアルで表してツイートしました。しかし、こちらはほとんど注目されませんでした。
こちらの画像を見てわかる通り、マンションが散在しています。申し訳程度に傾向線は引いてありますが、あまり傾向は見えません。よくない点について、1つは港区、品川区、江東区など様々なエリアが混ざってしまって傾向がばらけてしまったこと。もう1つは縦軸が金額のため、マンション同士の比較がしづらいという点です。
このように傾向が見えづらい、ということは比較しづらい軸で比べている可能性があります。同じ条件同士で比べる、という分析の格言に「Apple To Apple」(リンゴはリンゴ同士で比較せよ)という言葉がありますが、それを満たせているかを鑑みても良いかもしれません。
エリアがバラけると金額もばらけやすいですし、それぞれ面積が異なるマンションについては、金額よりも坪単価という軸で揃えてあげたほうが比較しやすく、傾向が見えやすくなるでしょう。
散布図は多くの属性を詰め込める
翻って、こちらが改良したデータです。年数と坪単価にしたことで、先程より価格の関係がはっきりと見えるかと思います。
さらに築年数と坪単価以外にもマンションは多くの属性を持ちます。面積、駅徒歩分数、戸数、間取りなど…多くの属性があります。分析においては次元が増えると言います。散布図では、縦横軸に加え、色、形、大きさなどを詰め込むことで多くの次元を表現できます。
今回の散布図では
・横軸 - 築年数
・縦軸 - 坪単価
・大きさ - 面積
・色の濃淡 - 駅徒歩分数
・形 - タワーマンションかどうか
を表現しました。これにより個別のマンションに注目する際もどのような特徴があるかを直観的に判別することができます。
その他、カテゴリ毎にばらつきを分解したい場合は箱ひげ図を利用したりします。以下は同じデータについて徒歩分数をカテゴリとして坪単価をビジュアライズした例です。築年数や、港区内のエリアも多様に含まれているので、一概に徒歩分数と坪単価の関係は断定できませんが、同じ築年代、類似エリア、面積などで絞るともう少し傾向が出るかもしれません。(当然ですが、築年代が新しいものの方が各箱ひげで上位の傾向は見られますね)
まとめ
今回はNFTから離れて、ビジュアライズについて書きました。多くの属性を持つデータを見るにあたって、データビジュアライズの力は非常に大きいものです。個人的に、人間の能力はデータをそのまま認識することより画像で認識することの方が向いているように発達してきたのではないかと思います。
ビジュアルにおいては、比較しやすい条件でデータをまとめること、傾向が見えなければまとめる単位について再考を検討することを書きました。
さらに、今回のビジュアルで利用した散布図は多くの属性を詰め込めるため、対象の属性が多い場合は使い勝手が良いことについても述べました。ビジュアライズの技法については、散布図に限らず多くの技法が存在します。興味のある方は色々と調べてみてください。
次回からまた、NFTの記事に戻ります。