見出し画像

DPC調査データをBIツールで可視化すると治験に活用できそうです

こんにちは、kudoです。今回は、オープンデータであるDPC調査データを治験に活用する方法を検討してみたので、その内容を紹介します。結論としては、BIツールを使って可視化することで、医療機関の選定時に活用できそうであることがわかりました。

背景

とある日のこと、DPC導入の影響評価に係る調査(以下、DPC調査)のオープンデータを見る機会がありました。データを眺めていたところ "治験に活用できるかも。。。" と思いましたので、活用方法を検討することにしました。

DPC調査については、以下の厚労省のサイトにて紹介されています。

私がデータを見たときには、平成30年度(2018)の結果が最新版であったため、以下のサイトに記載されている平成30年度のデータについて検討しました。

使用データの選定

DPC調査では、退院又は転棟した患者に関するデータを医療機関別に集計しており、様々な種類の集計データが公開されていましたが、特に "使えそう" と思ったデータは【疾患別手術有無別処置1有無別集計】です。

理由は、疾患別のデータ件数が医療機関別に集計されているからです。以下の画像が例示になります。

1.疾患別手術有無別処置1有無別集計_MDC01

医療機関別 x 疾患別のデータなので、自分の業務経験から ”医療機関の選定や被験者募集などに使えそう" と思いました。なお、退院又は転棟した患者に関するデータ件数を医療機関別に年間集計していることから、データ件数が多い医療機関 ≒ 患者数が多い医療機関という仮説で活用方法を検討しました。

サイトには、似たような名前で以下2つの集計結果も開示されていますが、記載の通りの理由から、検討対象から除外しました。

・疾患別手術別集計
手術に関するデータが詳細に集計されていますが、その反面、前処理(データの分析前加工)が複雑になりそうなデータでした。手術に関する詳細データは無くても大きな支障はないと思ったため、除外しました。

・疾患別手術有無別処置2有無別集計
治験での活用を考えたときに、処置2有無別のデータではなく、処置1有無別のデータで問題ないと思ったため、除外しました。

他には【分析対象外としたデータの状況】のデータも参考値として活用できると思いました。これは分析対象外としたデータ数を理由別に集計しているのですが、理由の一つに"治験実施"があります。以下の画像が例示になります。

2.分析対象外としたデータの状況

これは、DPC調査にて集計された治験被験者のデータ件数を示していることになりますので、以下の2点が確認できると思いました。
・各医療機関における治験実施経験の有無
・他の医療機関と比較した治験実施規模

医療機関別に表示されているため、疾患別の割合は不明です。なお、DPC調査にて集計されたデータ件数であり、医療機関の年間治験患者数ではない点にご注意ください。

データ活用のためのツール

活用できそうなデータが見つかったものの、Excel形式で見づらい状態であるため、データを見やすい状態にする必要がありました。そこで今回はBusiness Intelligence(BI)ツールのTableauを使用することにしました。

BIについては、以下の記事が参考になると思います。

データの可視化

Tableauにてデータを見やすい状態にした結果が以下になります。

以下2つの画面で主要診断群、診断群分類、都道府県、二次医療圏、市区町村、医療機関に応じたデータ件数を確認できるようになりました。
・平成30年度(2018) DPC調査
・平成30年度(2018) DPC調査_医療機関区分

実際に【平成30年度(2018) DPC調査_医療機関区分】の画面にて
<診断群分類>にて<ネフローゼ症候群>を選択
<都道府県>にて<神奈川県>を選択
すると以下のように表示されます。

3.平成30年度(2018) DPC調査_医療機関区分の例示

また、以下2つの画面では都道府県、二次医療圏、市区町村、医療機関に応じた治験被験者のデータ件数を確認できるようになりました。
・平成30年度(2018) DPC調査_治験被験者件数
・平成30年度(2018) DPC調査_治験被験者件数_医療機関区分

先ほどの例示の画面から【平成30年度(2018) DPC調査_治験被験者件数_医療機関区分】の画面にタブを切り替えると以下のように表示されます。

4.平成30年度(2018) DPC調査_治験被験者件数_医療機関区分の例示

選択した情報について、各画面で共通する場合にはデータが連動するようになっておりますので、先ほどの例示では、<都道府県>にて<神奈川県>を選択することで、他の画面でも自動的に神奈川県が選択されることになります。

なお、画面は4つありますが(データ出典詳細の画面を除いて)、画面名に【医療機関区分】が付いていない2つの画面は、都道府県、二次医療圏、市区町村別の集計結果を確認するときなどに便利です。

例えば、先ほどの例示の画面から【平成30年度(2018) DPC調査】の画面にタブを切り替え、以下の例示のように画面左側のリストから<二次医療圏>の<川崎北部>をクリックすると、その地域のデータ件数が52件であることがわかります。

note_Tableau DPC調査

活用方法

データを可視化した結果、主に医療機関選定に活用できると思いました。医療機関選定といっても様々な観点(治験対象患者数や実施体制など)がありますが、治験対象患者数が多いと思われる医療機関をピックアップする目的での活用に適していると思います。

具体的には、例を示したように、治験の対象疾患を<診断群分類>にて選択して、データ件数が多い医療機関を候補先としてピックアップする使い方です。他ソースの情報(例えば、SMOや治験依頼者が把握している情報)と併せて検討することで、候補先の医療機関情報の精度が向上すると思います。

また、治験被験者のデータ件数も併せて確認することで、治験慣れしている施設か否か、参考情報として確認できると思います。

他の使い方としては、実施中の治験における被験者募集でも活用が可能かもしれません。例えば、症例エントリーが滞っている医療機関の周辺に、データ件数が多い医療機関(≒ 患者数が多い医療機関)が存在するか確認するために使用することもアリだと思います。場合によっては、協力要請を打診するなどのアクションに繋がるかもしれません。

なお、活用時にはDPC調査の以下の特徴を考慮して使用することがよいと思います。
・外来診療の患者データは集計されていないこと
・DPC制度の基準を満たした医療機関のみ集計されていること

まとめ

・DPC調査データを治験に活用する方法を検討してみた
・データを活用するための手段としてBIツールで可視化した
・データの可視化により、医療機関選定・被験者募集に活用できそう

最後に

治験では、医療機関を立ち上げても被験者が集まらず、その医療機関を終了(クローズ)して、別の医療機関を立ち上げることがあります。原因は、医療機関選定時の予測と現実の乖離などがあげられますが、これにより、コスト追加や人的リソース(CRAなど)の逼迫が発生してしまいます。

今回紹介した内容を活用することで、このような課題の解決に貢献し、コスト削減や人的リソースの確保につながるかもしれません。

BIツールという観点では、データサイエンスやデータビジュアライゼーションといった視点での活用が進んでおり、業界内でも以下のようなコンソーシアムが設立されています。今後、使い方やデータの組み合わせ方などを色々と工夫することで、さらに活用方法の幅が広がると思います。

例えば、今回紹介したDPC調査データと各組織が保有するクローズドデータ(例えば、社内で蓄積してきたデータ)をBIツールを使って組み合わせることで、さらに踏み込んだ発見があるかもしれませんね。


ご質問等がありましたら以下までお問い合わせください
advance10101@gmail.com

いいなと思ったら応援しよう!