コロナウイルス 感染者数のトレンド、以前のコードの修正と東京の今後の予想
以前以下のような記事を書きました。
Yahooや動画等でいろいろ感想や考えを述べられる方と、実際の数字からのシンプルな予測と、どうかという物でした。結果は皆さんのご存知の通りです。
データの形式や入手先も以前から比べると整備されてきているようなので、フォローアップもかねて改めて現状を確認してみようと思います。
コロナウイルスに関する記述があります。
筆者は感染症の専門家ではありませんので、不正確な情報かもしれません。
データサイエンスの観点のうち、データの取得、グラフの形状的なことにこの記事では集中します。
現在、日本のコロナ関係のデータは以下のサイトから入手できます。
前回同様、Google Colaboratory、もしくはJupyter Notebookのような形で簡便に解析できます。
右上にある New Notebook のボタンをクリックし環境に移行します。
いつも通り[Shift]+[Enter]で実行するとPythonでデータの解析ができます。
データはKaggle Notebooksさんの方で準備してくれています。
/kaggle/input/covid19-dataset-in-japan/covid_jpn_prefecture.csv
/kaggle/input/covid19-dataset-in-japan/covid_jpn_total.csv
/kaggle/input/covid19-dataset-in-japan/covid_jpn_metadata.csv
あるということなので、それを読み込んで作業の下準備を行います。
corona_df = pd.read_csv('/kaggle/input/covid19-dataset-in-japan/covid_jpn_prefecture.csv', index_col=0)
display(corona_df.head(10).append(corona_df.tail(10)))
日本だけのデータのようです。データは2020-03-18から2021-06-11までのようです。
前回の記事では MM/DD/YYのフォーマットで日付が入っていたのですが、今回はYYYY-MM-DDのフォーマットのようです。そのあたりもありますので、今回更新記事を書くことにしました。
corona_df_JPN=corona_df[corona_df["Prefecture"]=="Tokyo"].copy()
corona_df_JPN["日付"] = list(map(lambda x: pd.datetime.strptime(x, '%Y-%m-%d'),corona_df_JPN.index))
display(corona_df_JPN.head().append(corona_df_JPN.tail()))
display(corona_df_JPN.info())
今回はTokyoのデータだけ、抜き取ります。またフォーマットからdatetime64のものに変換します。
次にグラフに表示・可視化します。プロットするデータは感染者数で季節調整(曜日による調整)として7日前との差分とします。
import matplotlib.pyplot as plt
import matplotlib.dates as mdates
fig = plt.figure()
plt.rcParams["font.size"] = 18
mmdd=mdates.DateFormatter('%m/%d')
fig, (ax1 ,ax2 )= plt.subplots(2,1,figsize=(10,9),
gridspec_kw = {'height_ratios':[1, 1]},sharex=True)
ax1.plot(corona_df_JPN["日付"],corona_df_JPN["Positive"].diff(7),label="Positive")
ax1.grid(True)
ax2.plot(corona_df_JPN["日付"],corona_df_JPN["Positive"].diff(7),label="Positive")
ax2.set_yscale('log')
ax2.grid(True)
ax2.legend(loc='center left', bbox_to_anchor=(1, 0.5), fontsize=18)
ax2.xaxis.set_major_formatter(mmdd)
ax2.xaxis.set_major_locator(mdates.MonthLocator())
fig.autofmt_xdate(rotation=90)
fig.show()
いろいろ分析する人によって見え方も違うように見えますが、
私には2カ月程度かけて上昇して、一カ月から一カ月半程度で減少する
ように見えます。これは個人的な主観です。
もし、上記が正しいなら、現在の減少は今月の中旬には再度増加に向かうのかな、、上昇のピークは8月上旬かな、、(8月って、イベント控えてますが、大丈夫でしょうか)なんて思う事も出来ます。
実際どうなるかわかりません。
ただ、心配されている凄腕データサイエンティストもいらっしゃるようなので、あながち大外れでもないかもしれません。
不安を的中させたくない場合は
とにかくワクチン2回接種済み人口の割合を増やすしかない
以前とは違う環境を作るしかないと思います。
ご自身でさらに解析してみたい場合などのお役に立てれればと思います。
最後に
「ツールとして利用していただき」、
「いたずらに不安を煽らず」、
「備えるために必要な情報」
としていただければと思います。
2021/07/15 追記
現状ではこのようになっています。
本日は東京の感染者は1308人のようです。
ワクチン接種が進んで、重傷者の数が減るようだといいですね、、
引き続き警戒しながら注視していきましょう。