見出し画像

10代は家や駐輪場以外に自転車を停めるときは要注意!! データアナリストへの道#8

デジテック for YAMAGUCHI 運営事務局 兼 Y-BASEスタッフのハラマルです。
突然ですが、先日の天皇杯、夢が現実になりかけました。レノファ山口が天皇杯でヴィッセル神戸に勝つ(勝てそう)という展開で、会場は大興奮でした。レノファの選手たちは非常に素晴らしいパフォーマンスで、負けはしましたが、会場に応援に駆け付けた方からは大きな拍手がありました。
こんな試合に出くわすと、もうサポーターになってしまいますよね(笑)
リーグ戦でも良いパフォーマンスが期待できそうです!

さて、これまではTableauでグラフを作ること、作り上げることで満足してきましたが、これまでに学んだスキルを使えば、違う分析ができるのではないか?と思うようになりました。同じデータを使って、当初に手を付けた「山口県の自転車盗2020年」にもう一度チャレンジしてみようと思います。

山口県の自転車盗の発生箇所

まず、前回はマッピングを最初にしてみました。それがこちらです。

前回作成した市町別の発生件数

改めて見てみると、これ、かなり分かりづらいですね!過去の私が大変失礼しました。
市町別の件数を〇の大きさで表しているのですが、〇を置くポイントが市町の役場所在地になっています。これを地図上で表してしまうと、誤解を与えてしまいますね。面積が広い下関市は、北部では全く事件が起きていないような印象になってしまっています。

前回は、こんなのも作成しました。

前回作成したマッピング(人口比)

人口比の発生件数を市町別に塗ったものです。周南市が一番色が濃いことが分かったものの、他の市町とはどれくらい差があるのか?といったことが分かりません。
マッピングできたことに満足感を覚えてしまいましたが、データ分析という観点からは全然駄目ですね~。

今、新しく作るなら、このマッピングでしょうか!?

自転車盗発生箇所2020年

どうでしょうか?前回作成した2つと違って、発生箇所が視覚的によく分かるかと思います。
これは、元々、発生個所のデータ(〇丁目まで)があったので、新しく学んだスキルを使って、「地理院マップシート」で座標データを取得して、それを落とし込んだものです。
元データの粒度が荒かったので、ピンポイントで示すと誤解を招くおそれがあったため、大きめの〇にして範囲が分かるようにしたのですが、それにより、エリアが分かりやすくなったと思います。
これで、山陽側と山口市中心部で、自転車盗が多く発生していることが分かりますね!

また、地図上では市町間の差が分からないので、新しく、人口比でこんなグラフを作ってみました。

市町別発生件数(人口比)

地図と同じで、周南市が県内トップということが分かるのですが、こちらのグラフにすると、実は、施錠していなかった場合は、周南市は岩国市・防府市と同程度であることが分かりました。施錠したにも関わらず被害が生じている件数が多いことが県内トップの理由になっていることが分かりました。
人口比でみると、平均を超えているのは、周南市、岩国市、防府市、山口市、下松市、宇部市、下関市、山陽小野田市の8市であることが分かりました。これ以外の市町とは結構差がありますね~。

山口県の自転車盗の発生時間帯

次に、発生時間帯別の分析です。前回作った時間帯別の発生件数グラフはこちら。

前回作成した時間帯別の発生件数

朝7時頃と夕方5~6時頃に山があること、施錠していない方の件数が圧倒的に多いことが分かりました。
が、改めてみると、こちらも、施錠の有無(青とオレンジ)を直接比較できないので、両者の差が抽象的にしか捉えることができず、「圧倒的」みたいな言い方になってしまっていました。

今、作り変えるなら、こうでしょうか。

時間帯別に平均線を追加

単純に平均線を追加するだけでも違いがよくわかるようになりました。
ここで追加した「平均」は、施錠の有無に関わらず、1時間ごとに発生している件数で、15.7件になりました。
施錠していても、朝の7時、8時は、平均値を上回る件数が発生しているんですね!これは新しい発見です。
施錠していなかった場合は、夜間を除いてほとんどの時間帯で、平均を上回る件数が発生しています。

あるいは、こうすると、もっと差が視覚的に分かります。

施錠の有無を並べて同じ表に表示

「施錠の有無」を、「行」から「列」にドラッグアンドドロップするだけで、このようにグラフが変わりました。
時間ごとに2つの縦棒を並べることによって、施錠していない場合の発生件数は、施錠していた場合と比べ、朝7時は3.5倍以上、夕方5時・6時は4~5倍にもなる、ということが分かりました。

山口県の自転車盗の被害が起きる場所

お次は、被害が発生した場所(統計上の区分)の分析です。前回作成したグラフはこちら。

前回作成した自転車盗被害場所(時間帯別)

前回は、これを見て、3階建て以下共同住宅等と、その他で被害が多いという分析をしました。
これをどう改良しようかなぁと考えていると、Tableauワークショップでお聞きしたことを思い出しました。たくさんの色があると、ぱっと見はきれいかもしれないが、分析しきれませんよ、といったお話があったように記憶しています。
ここは思い切って、色を3段階だけで表すように変更してみます!

色の設定を変更し3ステップ表示へ

たったこれだけですが、印象が変わりました。目に入るのは「その他」だけですね。
どこに置いていても一定の件数が発生してしまっているが、家や駐輪場といった通常の置き場でないところに駐輪する際(「その他」)は、特に件数が多いので要注意!ということが読み取れるかと思います。
前回は、3階建て以下の一部についても目が行っていましたが、大きな傾向を見る際には捨象してもよい範囲だということが分かりました。

山口県の自転車盗の被害者の年齢

前回作成した被害者の年齢別発生件数

これが前回作成した被害者の年齢別の件数です。10代・20代が多く、施錠していても一定の被害に遭っていることが分かりました。
そもそも自転車を保有している数が年代によって違うので、これ以上の分析は難しいなぁと思っていました。

さて、今なら、ここからさらに別のグラフを作ります。例えば、こんなカンジでしょうか!?

被害者の年齢別の場所別発生件数

被害の場所別に分けて、10代と20代だけ着色してみました。
4階建て以上、3階建て以下とも共同住宅では、10代・20代とも同程度の被害に遭っていますが、「その他」で大きく差がついていることが分かりました。年齢によって自転車保有率が違うでしょうから、年代間の差が生じるのは当然だとは思いますが、「その他」は10代・20代の差が大きすぎるので、場所的な特徴があるのでは?ということがうかがえます。ここが注意しなければならないポイントのようです。

被害者の年代別自転車盗発生箇所

続いて、今回最初に作ったマッピングで、被害者の年齢別に着色してみました。
そうすると、10代に比べて、20代が被害に遭っている箇所が集中していることが分かりました。

う~ん、この辺りから推測されるのは、人口が多いエリアでは一定の被害があり、10代も20代も同じように被害を受けているが、10代は、さらに他のエリアでも被害を受けているということでしょうか。
20代は社会人が多いでしょうから、この青丸が集中しているエリアでは、自転車で通勤が多いエリアということなのかもしれません。移動手段として自転車が用いられている割合と比例しているのかもしれませんね。

この項目では、被害が大きい層に絞って見てみると、新たな発見がありました

市町別の傾向

最後に、市町別の傾向を見るためのグラフを新しく作ってみました。色々な組み合わせをやってみましたが、これが分かりやすい気がします。

市町別・時間帯別の発生件数

縦軸に人口比の件数、横軸に発生時間とし、覚えたての箱ヒゲ図も追加しました。
人口比で件数の多いトップ3の市にどのような傾向があるのか見てみることにして、この3市だけ着色してみます。

全体の傾向として、夜間や9~12時は市町ごとのばらつきが少なく(箱が小さい)、7~8時や午後の18時までにばらつきが多い(箱が大きい)ようです。
周南市は、18時に飛びぬけて多いことがパッと見で分かりますが、前後の17~22時の間にも他市町と比べて多いことが分かります。また、7~8時、12時にも多く、注意しなければならない時間帯が多いです。
岩国市は、朝の時間帯は、6時に多いものの、7~8時は他市町よりも少ないです。代わりに14時から18時の間と、20~21時に多いです。
防府市は、7時にかなり多いですが、前後の5~8時も多いですね。11時と18時というピンポイントの時間帯で多いのが特徴のようです。

もうちょっとイメージしやすいように、今回の最初に作ったマッピングにフィルターをかけて、発生時間帯別にしてみたいと思います。被害の多い7時と、17・18時の2つのパターンを作ってみました。

発生時間7時
発生時間17時と18時

こうすると、時間帯ごとに注意しなければならない場所がより具体的にイメージできるかと思います。もっと地図を拡大していけば、この時間帯には、あそこには駐輪しては危ない!ということが分かるのではないかと思います。

まとめ

2020年の自転車盗という同じデータを使っているにも関わらず、前回と今回で、印象や気づきが大きく変わったと思います。
グラフの作り方を変えたり、平均線などを追加したり、特徴かな?と思われる部分にフォーカスして違う分析を加えたりすることによって、何通りもの分析が生まれることがある、ということがよく分かりました。
そういう意味で、簡単な操作でグラフの形式や比較対象を変えることができるTableauというツールの素晴らしさも実感しました。

同じことを何回か繰り返したら真実に近づくかもしれません。
次があるかどうかは分かりませんが、新しいスキルを身につけたときは、もう1回チャレンジしてみるのも悪くないかもですね!

この記事が参加している募集