e-Statのデータで心不全パンデミックを可視化してみた
私は現在AIエンジニアをやっておりますが、時にBIが恋しくなるときがあります。普段ゴリゴリに統計を考えて頭が疲れるので、ぼやーっと生産性のないグラフを無性に眺めたくなることがあるのです。
ということで、Tableauでe-Statのデータを使ってダッシュボードを作ってみました。(1年くらい触っていなかったので、なんか手触りが気持ち悪かったですw。)
作ったダッシュボードのリンクはTableau serverに置きました。自由にダウンロードできるので改変等はお好きに(ただし、作った際は教えていただけると嬉しいです。)
見た目はこんな感じ
心不全パンデミックとは
近年の日本では、生活習慣の変化や少子高齢化の影響などの要因で特に高齢者の心不全が急増している背景があり、それを「心不全パンデミック」と呼ぶことがあります。
心不全は簡単に言うと、心臓機能が弱体化することで血液の循環がままならない状態になり、呼吸困難・むくみ・動悸・疲労感などのさまざまな症状が引き起こされます。基本的に根治する疾患ではないため、病院に通い続ける必要があり、QOLは下がりつつ医療費もかかってしまいます。
そんな心不全患者の増加は今後解決していかなくてはならない課題でありますが、現状で120万人、5年後には130万人まで増加するという推定値が出ています。
ということで、増加の一途を辿る心不全、もう少し広く捉えて心疾患がどれくらい拡大しているのかをTableauで可視化してみました。
使用したデータ
今回は総務省統計局が出しているe-Statの「人口動態調査」から主に死亡数のデータを使用しました。なので、現在心疾患を発症しているはずではなく心疾患が原因で亡くなった方を集計していることに留意してください。
URLは「https://www.e-stat.go.jp/dbview?sid=0003411998」です。
DBの機能でダウンロードを行ったら一定の行数で分割されてしまったので、以下のCMDプロンプト(.bat)を使用して各CSVファイルを縦結合してからTableauに接続しました。
@echo off
setlocal enabledelayedexpansion
set /a counter=0
for /f %%i in ('dir /b *.csv') do (
echo %%i
if !counter!==0 (
set /p _head=<%%i
echo !_head!>>result.csv
)
set /a counter=!counter!+1
for /f "tokens=* skip=1" %%b in (%%i) do (
echo %%b>>result.csv
)
)
pause
※ダッシュボード上では、右上の💡マークにデータセット情報を記載しております。
作成したダッシュボード
共通事項として、表示年次(2015~2022年)を切り替えられるようにしています。昭和までさかのぼれるともっと良い可視化になりますが、粒度が揃ったデータの範囲が8年間だったので諦めましたw。
また、2020年以降はCOVID-19によるパンデミックの影響も少なからずあることに注意が必要です。
「概要」ダッシュボード
ざっくりとした心疾患系死亡数を可視化するために5つの要素を用意しました。
心疾患系死亡数
中年層以上の死亡数が近年増加しています
心疾患系死亡割合
2015~2016年が顕著に高く、一度は下がりますが、再び上昇しています
心疾患系死亡数ピラミッド
高齢者が多いです
割合でみると、男性の特に中年層は高いです
自宅での心疾患系死亡割合
中年層が高いです
男性が高いです
年齢別死因Top3
中年層以上では常に心疾患がTop3にランクインしています
新生児の死因として、遺伝子由来の心疾患が多いです
即ち、近年は心疾患系の死亡数が上昇している。年齢層で見ても、心疾患が主要な死因となっている。男性の中年層は女性に比べてリスクが大きいということが分かります。
「自宅での急死」ダッシュボード
心疾患が怖いのは、元気そうだった人が急に心肺停止に陥って亡くなってしまうということです。即ち、病院にかからずに適切な治療を受けられないまま死亡してしまうケースが特に多いということことです。
なので、自宅で亡くなってしまった方を可視化することは、少しでも以上を感じたら病院にかかり適切な治療を受けること、心疾患に気を付けて日々予防の取り組みをしていくこと、をメッセージとして伝えることができると考えました。
そこで、上記の概要の他に自宅での心疾患系の死亡数にフォーカスしたダッシュボードを作成しました。こちらも5つの要素を用意しました。
また、心疾患系の死因をフィルタリングできるようにしたため、気になった疾患について詳細に調べることができます。
自宅での心疾患系死亡数
中年層以上の死亡数が近年増加しています
特に、2022年は高齢者の死亡数が10%も上昇しています。おそらく、COVID-19の影響だと思います
自宅での心疾患系死亡割合
上昇トレンドがあります
中年層は特に高いです
若年層も8年で5%上昇しています
自宅での詳細死因
高血圧性、虚血性心疾患の割合が多いです(生活習慣病と関わりがあるものです)
特に中年層は5~7割が自宅での死亡を占めています
自宅での心疾患系死亡数ピラミッド
自宅に限ると男性の方が心疾患系の死亡数が多いです
施設別の心疾患系死亡数内訳
病院が一番多いです
次点で自宅が多いです
即ち、心疾患が原因の自宅での急死も近年上昇している。場所としては病院に次ぐ2位(介護施設や老人ホームよりも多い)。中年層が特に要注意。男性の方が多い。原因は生活習慣病によるものということが分かります。
私自身そろそろ中年層の男性なので気を付けようと思いましたw。
ということで、久しぶりにTableau触ってみたの記事でした。また、普段データ解析の対象としているような属性にどのような特性があるかを調べることができて良かったです。
フィードバックがございましたら、是非コメントいただけると嬉しいです!
最後までお読みいただきありがとうございました。
記事を読んでいただきありがとうございました。いただきましたサポートは自己研鑽のために活用し、さらに良質な記事を執筆するために使います。のんびり更新ですが、多くの方に役立つコンテンツを書いていきますのでよろしくお願いいたします。