新型コロナの数字の見方
なぜ先週の同じ曜日と比較をするのだろう?
テレビニュースの質の低さにうんざりして観なくなって久しいものの、リモコン操作一発で時事ネタを流してくれるのはやっぱり便利かもなぁとも思う今日この頃。そんな気持ちでテレビをつけるとCovid-19の感染者数とかは当然毎日報道されるわけだが、そのやり方が意味わからんことになっているので記事にしてみようというのが今日のお話。
ちなみに今の数字を追いたいなら厚生労働省のサイトを見るのが一番手っ取り早い。世界の数字を見たければJohns Hopkins大学のサイトが良い。
https://www.mhlw.go.jp/stf/covid-19/kokunainohasseijoukyou.html#h2_1
https://coronavirus.jhu.edu/map.html
話を戻して、テレビニュースの謎の一つが冒頭の「先週の同じ曜日と比較して〇人増えました/減りました」というやつ。あれは何がしたいのだろう。
※ついでにもう一つ挙げるとやたらと東京の数字ばかり強調していること。都内向けニュースなら分からんでもないが、首都圏ニュースでも全国ニュースでもやるのはなぜなんだ。確かに東京は人も多いし、感染者も多いし、全体のトレンドを引っ張ってはいる。日本全体の縮図が東京と言ってもいい。だが逆にそれならば日本全体の数字だけみれば充分とも言える。全国と東京のトレンドが乖離したときがニュースになるなら分かるが、まず東京の数字ありきで報道されるのは違和感がある。
先週の同じ曜日と比較している例では
https://www.pref.kanagawa.jp/docs/ie2/message/20210224.html
https://news.yahoo.co.jp/articles/cc5ab8cb79086dfba79e784da8d4d26755585b38
こんな風にカレンダーの日付に感染者数を付けて表わすことが多いようだ。こういう分析の仕方はデータに周期性がある場合に良く使われる。例えば映画館で毎週水曜日をレディースデイにして割引をしていたとすると、水曜日は他の曜日よりも女性客が増えるだろうと期待できる。実際どのくらい効果があったかを見るためには、他の曜日も含めた平均と水曜日だけの平均を比較する。平均だけではなく日々のバラつきを標準偏差などにしてみるのも重要だ。この様にして全体のトレンドと、一定周期で訪れるイベントを分けてみることができる。
しかしニュースでは平均値と標準偏差を用いるのではなく、ある一日とその一週間前を単純比較している。これでは分析しているとは言えない。例えば毎日ランダムに±100人程度増減しているのに、「先週の同じ曜日と比較して50人減りました」といわれても、それは偶然でしょうとしか言えない。そもそも先週と比較するなら、1週間周期で感染者数に波があるのでなければ意味がない。(逆にデータに波があったら〇曜日に感染者を増やす要因がありそう!という仮説が立つ)実際のデータをみても、特に曜日による波は見受けられないので、やはり1週間前と比較するのは意味が分からない。
これと同じ理由で、「昨日より〇人減った/増えた」もあまり意味がない。では感染者数が増えているのか、減っているのかを見るにはどうすれば良いか。感染対策が上手くいっているのかいないのかは、多くの人が知りたいことだろう。グラフで見て「いい感じっぽいな」でも良いが、ちゃんと数字にしたいなら、簡単なのは移動平均だ。
例えばこれはPCR検査で陽性となった人の人数を縦棒グラフで表したものだ。これだけでも年末から1月中旬にかけて一気に陽性者数が増えて、最近は減ってきていることが見て取れる。そしてグラフはギザギザしている。このギザギザがバラつきだ。これに移動平均線(7日)を加えるとこうなる。
ギザギザがならされて平滑な線になった。Excelだと移動平均線は「近似曲線の追加」で簡単に作れる。7日間移動平均で見ると2月23日~3月1日は1004人。その前週は1224人、さらに前週は1446人となる。こうすればバラつきを差し引いても先々週より先週、先週より今週の方が感染者数は減ってきていると数字で示すことが出来る。
※データ解析が得意な人はもっと理論的で厳密なやり方ができると思うが、毎日のニュースレベルならこのくらい簡単でいいと思う。
テレビニュースが移動平均すら使わず1週間前との単純比較をしているのはおそらく、
・移動平均を知らない/理解できない
・移動平均を理解できない人にも伝わるように番組を作らなければならない
・視聴者は移動平均を理解できないと思っている
のどれかだろう。製作者に対して好意的な解釈は2番目だ。実際、大事な視点でもある。情報を分かりやすく噛み砕いて伝えるのは良いことだ。だが、この場合、噛み砕くというよりも一部だけ抜き取るようなやり方になってしまっている。(そもそも噛み砕くほど難しい情報か?)例えると、プリンを食べやすくしろと言ったらカラメルソースだけよこしやがった、みたいな状況だ。
ちなみに感染者数よりもむしろこちらの方が重要だ。こちらは感染後、発症して治療を受けている人の累計だ。累計なので最新の報告値=その時点で治療を要する人の総数だ。3月2日0時現在で13188人となっている。この人数が多ければ多いほど、医療への負荷が高いと言える。70000人越えのピークを乗り切れて本当に良かった。
長くなるのでこの辺で締めるが、厚労省の数字を見る限り検査陽性だが「治療を要する者」にカウントされなかった人は1割くらいしかいない。本当に無症状だったからPCRを受けることもなかった人もいるかもしれないが、罹患すれば高い確率でそれなりに苦しい思いをすることになるのは間違いないだろう。治療中の13188人の内、413人が重症者だ。433,504人の陽性者の内、7933人が亡くなっている。私たちがそこに加わらない保証はどこにもない。
人類はまだ勝ってはいない。勝ちきるまで油断はできないのだ。(キリッ
なんてね
この記事が気に入ったらサポートをしてみませんか?