見出し画像

社内転籍で医療専門職からデータアナリストにチャレンジ!

自己紹介

はじめまして!
株式会社PREVENTのデータサイエンス部でデータアナリストとして働いている迫田といいます。
元々、理学療法士として病院での経験を積んだ後、2021年度より弊社の医療サービス部にてオンライン完結型の生活習慣病重症化予防プログラムの提供に関わっていました。
2022年の7月より、データサイエンス部の駆け出しのデータアナリストとして新しいキャリアをスタートさせております。

今回は、これまでの記事から少し毛色を変えて、社内転籍してデータアナリストになって取り組んでいることや、駆け出しならではの悩みをお話ししていきたいと思います。
年末年始の移動中にでもサラーっと読んでいただけると嬉しいです。

対象読者層

  • ヘルスケア領域におけるデータサイエンス部門での取り組みに興味のある方

  • これからヘルスケア領域でデータアナリストを目指す方

  • ヘルスケア領域で駆け出しのデータアナリストが実務でつまづくポイントに興味のある方

なぜ、データサイエンスの領域に転職したのか?

 そもそも何で医療専門職からデータサイエンスの領域に飛び込んだのかからお話しします。
 元々、医療現場で理学療法士として働いていた際に、実務でエビデンスを活用することや自施設で患者さんから得られるデータを集計し、自身でもエビデンスを創っていくことに関心がありました。
 エビデンスを創出することを目標に研究方法等を勉強する過程で、次第にヘルスデータを活用して、健康づくりを支援することに興味が湧き、弊社の医療サービス部で1年経験を積んだ後、データサイエンスチームに転籍しました。

転籍後に行ったこと

①Myscopeのオンボーディング

 データサイエンス部でのルーティンで行う業務の中に、Myscopeという健康保険組合から受領したレセプトデータや健診データを用いた分析があります。
 Myscopeを理解するにあたり、メンターとなるデータサイエンティストに1人ついていただき、データクレンジング、使用する統計モデル、顧客へ納品する際のレポーティングなどを教えていただきました。
 また、既に解析を終えた過去のデータを再利用しながら、自身で手を動かし、分からなくなったらググったり、書籍で調べたり、それでも分からなければメンターに確認することを繰り返しました。
 なお、私以外のデータサイエンス部のメンバーは名古屋本社所属で東京ではデータサイエンス部は私1人のため、主なコミュニケーション手段はSlackやGatherを活用しならがらオンボーディングを進めていただきました。

②ドメイン知識の整理

元々、弊社の医療サービス部門で働いており、生活習慣病に関する基礎的なことは理解していたので、データ解析に際して、必要な知識を整理していきました。

  1. 特定健康診査の問診項目およびその回答内容の理解
     先に述べたMyscopeの解析に際して、特定健診の回答項目のデータの揺らぎやデータ変換を行っているため、標準的な健診・保健指導プログラム【平成30年度版】の標準的な問診項目や回答内容について知識を整理しました。

  2. レセプトデータの内容・構造理解

    1. レセプト生成に至るまで
      そもそも、どのような流れでレセプトデータが作成されているのかの理解が曖昧であったため、社会保険診療報酬支払基金のHPを参照しながら学びました。
      一般向けにもイラストを用いた説明がQ&A形式でまとめられており、非常に分かりやすいです。

社会保険診療報酬支払基金:支払基金ってどんなところ?

       2. レセプトデータの内容理解
   弊社では主に、医科レセプト・DPCレセプト、調剤レセプトを分析に
  使用しています。これらの内容を理解するために、国立保健医療科学院
  より公開されているレセプト分析法マニュアルや社会保険診療報酬支払
  基金から公開されている各種電子レセプト作成の手引きを参照しまし
  た。

③基本的なデータ前処理の方法理解

 元々、初心者向けのPythonの書籍を読んだり、オンライン講座などを受講して、基本的な内容は押さえていたつもりだったので、実務での使い方をデータサイエンス100本ノック(構造化データ加工編)を通して学びました。Python、SQL、Rに対応して学べるので個人的に初学者には非常にオススメです。
 最近は書籍でも100本ノックの様々なシリーズが出版されており、現在はデータ分析編SQLの基礎に取り組んでいます。

転籍後にぶつかった壁

環境構築

一般的に初心者がつまづきやすい点みたいです。
データの解析に際して、様々なツールをインストールすることになるのですが、そもそもターミナルの操作に慣れていなかったため、そこから非常に苦戦しました。
バージョンの細かな管理やPATHの設定GithubへのSSH接続など、分からないことだらけだったので、メンターに逐一確認しながら取り組みました。

前処理

 前処理に関しても、ドメイン知識としては整理したものの、実践では上手くいかない場面が多々ありました。
特定健診の問診の回答内容の揺らぎへの対処や被保険者台帳の情報における続柄への対応などまだまだ勉強中です。
 また、そもそも前処理に際してこれまで先輩方が作り上げてきたコード内容の理解にも時間がかかりました。
 最近では、実践的な資料やオープンデータも豊富にあるため、早めに実践的な内容に移っておけば良かったとやや後悔しております・・・

これから

まだまだ技術不足な面も多いにありますが、これから社内で仕事面、学術面で以下のような活動も行っていけたらと思っています。

顧客の個別ニーズへの対応

現在はレセプトデータや健診データを用いた分析を行っておりますが、組合様ごとに被保険者の特徴が微妙に異なるため組合ごとの個別ニーズに応じたデータ分析や保健事業のサポートにも携わりたいと考えております。

また、提供サービスであるMystarプログラム終了者の採血データや疾病発症状況の経年変化の調査なども実施していく予定です。

社内知見の蓄積

 組織によって役割は様々なようですが、弊社のデータアナリストは、イシュードリブンにビジネス判断や、課題解決に資するデータ分析・可視化等を求められています。
 このため、自身の医療専門職としてのバックグラウンドを活かした切り口で社内データを使った知見を徐々に蓄積していきたいと考えています。

社内スタッフのデータ解析サポート

 弊社の特徴の1つに臨床現場での経験のある医療専門職が多く所属しており、中には、論文執筆や学会発表の経験あるスタッフも所属しています。
 こうした医療専門職の日頃の疾病管理プログラムを提供する中でのクリニカル・クエスチョンをもとに研究に必要なデータセットの作成や解析方法のサポートにも取り組み、社外での発表に貢献していきたいと思っています。
 ちなみに、他部署のスタッフがデータサイエンス部への依頼を行う際、Slackのワークフローを投稿することで自動的にNotionにその依頼内容が同期され、依頼を見逃さないように設計されています。また、毎週部内でNotionを確認する時間を取り、Notionに上がった依頼事項を、メンバー間でタスクを割り振るような運用になっています。

問い合わせのSlackワークフロー

おわりに

 ここまで読んでいただき、ありがとうございました!
 まだまだ、勉強不足ではありますが、慢性疾患を抱える方が病気とうまく付き合いながら生活できる社会の実現に向けてデータアナリストとしてできることを日々模索し、研鑽を続けていきたいと思っております。
 少しでもヘルスケア領域におけるデータサイエンス部門での取り組みに興味を持っていただけたら嬉しい限りです!