見出し画像

今日から週1-2投稿を目指して、Tableau100本ノックを開始します!

データサイエンティストになって、
世界中どこでもバイネームで指名されて仕事ができるようになりたい!

そんな目標を持ち、気づけば既に10年以上が経っていました…
もはや目標ではなく、憧れ(いや、幻?)とも思えますが、
何はともあれ、転職に成功した今の職場環境は
データサイエンティストが身近にいるという最高の環境!
人生の中でも千載一遇の大チャンス!

ということで一念発起して、
■データ収集と可視化:SQL・Tableau
■データ分析:統計学、Python・R言語
あたりが最低限レベルとして必要なのかなと思い、
まずはTableauを自在に使えるようになろう!と思い、
今週から100本ノックを始めることにしました。

最初はオープンデータで手に入るものとして、
総務省 統計局から、都道府県別の人口データをダウンロードしてみました。

データの中身をExcelで見てみると
都道府県に加えて市区町村まであり、全部で4000行オーバーのデータでした

さて、これをTableauで読み込み、
男女比ソート、5年間での人口増減率ソートを出してみました。


・男女比(女性の割合が多い順にソート)

長崎県が男性比率47.0%でしたので、女性の割合が最多でした。
ちなみに男性比率が最も高いのは49.9%の愛知県・茨城県・栃木県の3県でした。


・2015年→2020年の人口増減率(数値が大きい順にソート)

やはり…というべきか、東京都が最多の104%!
他にも神奈川・埼玉・千葉と1都3県が人口増の結果でした。
意外だったのは沖縄県の102%でした。
沖縄の良い気候でのんびり過ごしたいという人が増えているのでしょうか?
それとも出生率が高いのでしょうか?

ここまでTableauにデータを取り込んで計算して表示するのに約1時間…
でも、次回同じことをするなら多分15分くらいで出来そうです。

そんな今日の学びは、データの形式をExcelで最初に眺めておくこと!
でした。具体的には…

・データの形式を最初に確認し、
 見たい数値があればExcelで先に計算すると時短になる
 (男性比率を計算するのにも四苦八苦してしまった…)
・4000行のデータのうち、47都道府県だけを抜き出すのに
 時間がかかってしまった…
 (地域識別コードに対してフィルターを使えば一瞬でした…!)

ということで、今日から始まった「なんでもタブロウ 100本ノック!」
100本の投稿を終える頃には、立派なTableauの使い手になっているはず

ということで今日はこの辺で!
それではまたー!✨

いいなと思ったら応援しよう!