![見出し画像](https://assets.st-note.com/production/uploads/images/43733524/rectangle_large_type_2_0db7150da7ffbed56c69c928db03f0ea.png?width=1200)
Tableauでコロナの「今」を見る
さいしょに
2021年の初めから以下の本を参考にTableauについて勉強してきました。
この本は大変わかりやすい上に、ためになるのですが
扱ってきたデータは勉強用に作られたデータなんですよね。
現実世界の実際のデータを使い、自分の気になったことを深堀し、あわよくば現実世界のちょっとした課題を解決できたら儲けもんだなと思い、このプロジェクトをはじめました。
扱うデータ
このnoteの題名にある通り、コロナ関係のデータを扱っていきます。
データソースは総務省のオープンデータです。
その中でも以下表のデータを使って可視化をやってみました。
まずはザックリ概要把握
まずは今回取得したデータに誤りがないか
抜け漏れがないか等をチェックしていきます。
全てのデータに日付と人数の二つのカラムがありました。
それらのデータを使って、クロス集計表を作成します。
そうするとこれらのデータが集められた期間と
ザックリ人数が増えてるなあということがわかります。
データの期間は2020年2月〜2021年1月ですね。
上記のクロス集計を全4データ分作成します。
すると、陽性者数とPCR検査実施人数のデータでNullが発見されました。
何かがおかしい。この原因を深堀します。
何でNullなの?
まずはNullの元データを見ていきます。
Nullのデータをクリックして、右上の四角テーブルマークをクリックします。
するとこんな感じ
タブを切り替えて、pcr_positive_daily.csvをクリックすると
元データを参照できます。
すると、pcr_positive_daily.csvには日付が入っているのが確認できます。
これは恐らく結合方法が原因です。
どう結合しているかというと
case_total.csvをベースに他3つのデータを結合してました。
結合の際は日付をキーにしてました。
case_total.csvは入院者数のデータで2020年2月からデータが始まってます。
しかしPCR検査実施人数は2020年1月からデータが始まってます。
最も古くからデータがあるものをベースに結合しなかったので
今回の様なことが起きてました。
複数データから1つのグラフを作る
最終的なグラフイメージはこんな感じです。
以下手順でポチポチクリックしていくと下の表が自動的に作成されます。
⒈日付
2.PCR検査実施件数
3.PCR検査陽性者数
4.入院者数
5.死者数
上の図のメジャーバリューを行シェルフにドラッグします。
すると以下の折れ線グラフができます。
これを1つのグラフにしたいです。
メジャーネームをマークの色にドラッグすると
1つのグラフに纏まりました。
このままだと横軸が年のままなので、「日付」をドリルダウンして広げていきます。
するとこんな感じ。
これで複数の折れ線グラフを1つのグラフに纏めることができます。
メジャーバリューは複数のメジャーをまとめたもので
メジャーネームは複数のディメンションをまとめたものです。
メジャー単位でグラフを作成することで、複数の値を1つのグラフで可視化できます。
さいごに
可視化は完了しましたが、値の単位が異なるので
(死者数のみ今までの累計で、他はその日ごとの合計人数ため)
次回は元データを加工して、全ての値の単位を揃えてみようと思います。