コロナ感染者数を可視化してみた
きっかけ
毎日の報道で聞く『感染者数が、過去最高を記録しました』という言葉に、意図的に危機意識を煽っているような印象を持っており、実際どうなのか?をシンプルな方法で確認してみました。
#危機意識を持つ必要性は理解していますが、一方的な表現に違和感を覚えている、、ということです。
仮説とメッセージ
データを可視化にするにしても、ある程度仮説が必要、ということでコロナ感染者数の推移をグーグルで調べてみる。検索するとグラフで結果が出てくるグーグルには、脱帽です。
メッセージ・仮説:
「感染者数は増えているが、増え方は緩やかになっている。
なので、もうすぐ感染者数は減っていく。」
というメッセージを検証・可視化をします。今回データソースは、厚生労働省の「オープンデータ(2020/12/25)」より引用します。
データの可視化プロセス
まず、ダウンロードしたCSVファイルをTableauで開き、感染者の変化量を計算(微分)して、グラフにする。
sum([陽性者数(単日)]) - LOOKUP(sum([陽性者数(単日)]),-1)
・・・心拍数ですか?
土日の感染者がノイズになっているので、前後3日+当日の移動平均を出してみた。
#今気づいたけど、「前後3日」の「後」は、明日以降のデータなので本来は過去7日で平均は取ったほうが良いな、、
【陽性者数(移動平均)】
window_avg(sum([陽性者数(単日)]),-3,3)
【増加量(週移動平均)】
([陽性者数(移動平均)] - LOOKUP([陽性者数(移動平均)],-7))/7
データとしては、増加、減少が見やすくなった。あとは、「見やすく」して完了。
●「感染者数」の”単日”と”移動平均”は、同じデータで見せ方が違うだけなので、同じグラフで表現する。
●「増加量」は、「増えているのか?減っているのか?」を伝えるために、増加・減少を視覚的に表現するために、色を追加。
●ヘッダーの冗長な表現を調整 (i.e. 日付のラベル「日付の日」を消す、”2020年8月1日” → "2020/8/1"
●注釈を追記
結論・わかったこと
■ 第二波(2020/8頃)では、増加量のピーク(7/31)から約一週間後に、感染者数のピーク(8/6)を迎え、その後、感染者数は減少した。
■ 今回の感染拡大(第三波)において、感染者数の増加量は、11月20日をピークに下降傾向にある。しかしながら、増加量のピークを過ぎてから、約一ヵ月が経過するが、まだ感染者数は増加している。
➡ 確かに、増加量は減少しているが、前回に比べて、感染者数が下降に転じるまでの期間が長いのは、新たな発見でした。
さいごに
自分でデータを可視化してみると、報道されている内容もしみじみ理解することができるなぁ、と。「やってみよう」と思ってから、Step1のグラフができるまでは、10分くらい。Vizを調整して、このレポートをまとめるのに2時間程度でした。
今回作ったVizは、Tableau Publicにて公開しています。