新型コロナデータ分析:男女、年代別、地域別について(日本)
こんにちは、トキワです。今日は雪がすごかったですね。
今回は新型コロナのデータを使って色々分析してみた、という内容だ。
僕自身があまり他人の意見を信じられない性格をしているのと(すみません)知的好奇心旺盛な性格から、基本的にいつも最初に主張した人や実際に起きたことを記録したデータなどの「一次情報」を見るようにしている。
そんな性格が功を奏して、3年間データ分析が仕事だったこともある。仕事にしていたから「すごいんだぞ」とは言う気はない(いい仕事も悪かった仕事もあったから、、、)。ただ最低限データ分析の能力はあるつもりだ。
今回の新型コロナに関しても「そのうちおさまる」(ポジティブすぎ)とか「来週はロックダウンだ」(ネガティブすぎ)とか色んな人が色んなことを言っているけど、まったく信じていない。
信じていないからといって対策をしていないわけではなく、手洗いやアルコール消毒はもちろんしているし、密閉・密集・密接はもちろん避けているし、3月28-29日は予定を変更してあまり出歩かないようにしていた。
「類は友を呼ぶ」とはよく言うが、僕の周りにはデータ分析が好きな人が比較的おおい。そのため今日まで友人間でシェアされていたデータをもとに今後1-2週間を予測していた。
けどちょっと個人的にその友人のデータが物足りなくなったので笑、自分でデータを探して分析してみることにした。
そうするとまず各々のデータ自体が意外と合っていなかったり、質が悪かったり、PDFで分析しづらかったりした。その中でも悪くなさそうなデータが以下だ。
厚労省「新型コロナウイルス感染症について:国内の発生状況」
NHK「特設サイト 新型コロナウイルス」
JX通信社(スマートニュースにデータ提供)
新型コロナウイルス対策ダッシュボード(特に病床使用率について参考になる)
Wiki 日本における2019年コロナウイルス感染症の流行状況
ただこれらからはデータをExcelやCSVでダウンロードして自分で分析するには不便だったので、今回以下のサイトを参照することにした。
ジャッグジャパン株式会社「都道府県別新型コロナウイルス感染者数マップ(30分毎更新)」
こちらのデータでは死亡者数や重症者数はあまり正確にとれなかったものの(「ステータス」以外で取得できれば教えてください。もしくは集計してくださいお願いします。)、その他のデータに関してはしっかりデータがそろっていたのでこちらを選ぶことにした。
(一方でSIGNATEのデータもダウンロードして分析できたのだけど、そろってないデータもあって扱いづらかった。今後改善されること望む。)
では早速分析してわかったことを紹介していく。あまりテレビでは報道されていないようなことが分かったのだが、注意してほしいのはこの分析はあくまで「仮説=そうかもしれないレベル」であって、絶対的に正しい情報ではない。
※分析したスプレッドシートはこちらに貼っておく。
感染だけでみれば男性のほうが1.5倍しやすい
累積(今までの合計)で男性は978人、女性は679人が感染した。この数字だけを見ると男性のほうが感染しやすい。理由は分からないが、おそらく女性のほうが危機意識が高くて清潔なのかもしれないし、男性が仕事で外に出歩くからかもしれない。
※注意:あくまで傾向であって全員ではない。感染しやすいからと言って死にやすいわけではないし、退院した人は考慮していない。
若者は退院しやすく、40代以降の人は退院しづらい
正直これはサンプルが少ないかつデータがあまりきれいではないので、どこまで言い切れるか分からない。参考程度にとどめてほしい。(例えば60代の退院数が少ないとか、10代の退院数が感染者数を超えてるとか)
上の表を見てわかるように、20-30代の人は37-47%で退院しているが、40代以降になると20-30%に低くなる。これは単純に免疫力の強さだと思われる。
とはいえ若くても50-60%は退院しづらい。これは結構高い確率だと思うので、若者もできるだけ遊びたいなら感染には注意したほうがいいだろう。
無症状の人は約5-10%程度いる
今回個人的にはこれが一番興味深かったのだが、実は感染した人のうちの無症状の人は5-10%も存在するということだ。100人いれば10-5人。これが少ないと思う人もいるかもしれないけど、5人が移動したり会話したりすることで25人ぐらい感染者を増やせると思う。
東京の感染者数増加をどうみるか?
3月25日から急激に40人の感染者数となり、3月28日にはついに60人台となった。これをネガティブにとらえるほうが当たり前だろうし、ネガティブにとらえて外出を控えたり、政府は対策をうったりするほうが正しいと思う。(これはあくまで僕の解釈)
一方で、3月28日の63人のうちの29人は台東区の病院での院内感染である。これは外に広まっているわけではないし、多くの人が経験することではない(例えば電車にのる)。再現性のある増加方法ではないのだ。
なので3月27日は34人(63-29)の感染者として見積もるべきだ。同じように3月25日から27日の40人台も経路を調べて分析したかったのだが、データが見つからなかった。
感染者の個人情報が大事なのもあるだろうし、調査中なのもあるだろうが、経路だけはすぐにでも調べて公開してほしい。この情報があるかないかで安心・不安は大きく違う。
個人がどこまで注意できるかは他人への思いやりと自分の幸福度のバランス
僕は普段は社会問題の研究をしており、また解決手段としてソーシャルビジネスも行っている。環境汚染的な意味で言えば、水俣病患者に会ったこともあるし、世界で起きている水俣病を防ぐための条約へ政策提言もしたことがある。
そんな経験から言わせてもらうと、基本的に社会問題の犠牲者は常に少数派だ。少数派というのは多数決にも勝てないし、ビジネスチャンスとしても見られないから、救いの手を差し伸べてもらいづらい立場なのだ。
だから何が大事かというと、僕たち一人ひとりがその少数派の気持ちになれるかどうか、思いやりの気持ちを持てるかどうかなのだ。自分がすでに無症状の感染者だと思って行動することが大事だ。
とはいっても他人のことを考えすぎて、自分の幸せがないがしろになれば今度は別の問題が発生してしまう。ひどい人は鬱になってしまうだろうし、大きく見れば経済が悪化してしまう。
だからバランスだ。例えば若者はできるだけ高齢者のいない場所で遊ぶ、密閉・密集・密接を避ける。何か工夫してみよう。
被害を被ってしまいやすい人たち(例えば高齢者)も若者にイライラしてはいけない。
なぜならバカな人たちは絶対にいなくならないし(そう思って対策するしかない)、自分自身が多数派になって少数派を犠牲にしていることもたくさんあるからだ(常に自分が被害者ではない)。
またデータが更新され次第、定期的に分析して公表していこうと思う。特に経路別や、どんな人が死亡・重症化しやすいかも分析していきたい。その辺のデータセットがあれば。
もしこの記事がバズったら色んな意見(解釈)がくるかもしれないが、まずデータ(事実)を教えてほしい。