コロナ関係でやったことまとめ
そろそろコロナも落ち着いてきた感じです。私がコロナ関係でやったことをまとめます。
新型コロナ感染モデル
新型コロナの世界レベルの感染モデルを作りました。まだStanの使い方もまともに分かってなかった...仮定も間違っていたのでしょう、コロナの感染者は予測を軽々と超えていきました。
公衆衛生政策はCOVID-19を止めるのにどのくらい効果的か(日本版)
データサイエンスによる日韓のコロナ対策比較
ピーター・ターチン「公衆衛生政策はCOVID-19を止めるのにどのくらい効果的か」(2020年3月23日)の手法をベイズ統計学を使って日本に当てはめてみました。
ターチンの手法では増加率と検出率はシグモイド関数によって変化していると仮定されています。しかし、現実にはそれは当てはまっていませんでしたし、Stanの計算も収束していませんでした。
というわけで的外れな結果に終わってしまいました。感染爆発とか騒いですみません。
論文を書く
その後新しい手法で論文を書きました。
Simultaneous estimation of the effective reproducing number and the detection rate of COVID-19 https://arxiv.org/abs/2005.02766
実効再生産数Rtと感染者の検出率を同時に推定しようとしましたが、簡単ではありませんでした。また、ベースになっているのがSIRモデルという簡単なモデルで潜伏期間が考慮に入っていないため現実のRtの変化に追随できていないように思います。
「8割おじさん」西浦教授のモデルを読んで専門家やっぱりすごい、てなる
back-projectionという疫学で標準的に使われる手法を使って潜伏期間と発病から報告までの時間差を考慮に入れて感染数とRtを求めています。
まとめ
コロナは無症状や軽症ですむ人が多く、実際の感染者を把握することが難しいのが特徴です。上の西浦教授の推定では確認された感染者のデータだけ使っています。
重症化したり死亡する確率分布がわかればback-projectionによりある程度実際の感染者数を推定できるでしょう。全部込みでモデル化すればベイズ的に推定できるかもしれません。でも睡眠時間を削ってやっていたし、疫学者の方がうまくやると思うので、私はこれ以上はやらないことにします。
個人的にはベイズ統計学やStanのことがわかってためになりました。ベイズ統計学とStanについては
がとても参考になります。コードはPythonで書いていましたが、統計に関してはPythonはライブラリが不足しているのでRの方がいいかなと思いました。Rも勉強しなくちゃ。
この記事が気に入ったらサポートをしてみませんか?