今日から週1-2投稿を目指して、Tableau100本ノックを開始します!
データサイエンティストになって、
世界中どこでもバイネームで指名されて仕事ができるようになりたい!
そんな目標を持ち、気づけば既に10年以上が経っていました…
もはや目標ではなく、憧れ(いや、幻?)とも思えますが、
何はともあれ、転職に成功した今の職場環境は
データサイエンティストが身近にいるという最高の環境!
人生の中でも千載一遇の大チャンス!
ということで一念発起して、
■データ収集と可視化:SQL・Tableau
■データ分析:統計学、Python・R言語
あたりが最低限レベルとして必要なのかなと思い、
まずはTableauを自在に使えるようになろう!と思い、
今週から100本ノックを始めることにしました。
最初はオープンデータで手に入るものとして、
総務省 統計局から、都道府県別の人口データをダウンロードしてみました。
データの中身をExcelで見てみると
都道府県に加えて市区町村まであり、全部で4000行オーバーのデータでした
さて、これをTableauで読み込み、
男女比ソート、5年間での人口増減率ソートを出してみました。
・男女比(女性の割合が多い順にソート)
・2015年→2020年の人口増減率(数値が大きい順にソート)
ここまでTableauにデータを取り込んで計算して表示するのに約1時間…
でも、次回同じことをするなら多分15分くらいで出来そうです。
そんな今日の学びは、データの形式をExcelで最初に眺めておくこと!
でした。具体的には…
・データの形式を最初に確認し、
見たい数値があればExcelで先に計算すると時短になる
(男性比率を計算するのにも四苦八苦してしまった…)
・4000行のデータのうち、47都道府県だけを抜き出すのに
時間がかかってしまった…
(地域識別コードに対してフィルターを使えば一瞬でした…!)
ということで、今日から始まった「なんでもタブロウ 100本ノック!」
100本の投稿を終える頃には、立派なTableauの使い手になっているはず
ということで今日はこの辺で!
それではまたー!✨