統計解析業務について
分析屋の藤島です。
医療系データについて扱ってみたいという方を見かけます。
また近年レセプトデータや健診データの解析や分析も注目されていると思いますので、実体験をベースに統計解析業務について紹介したいと思います。
1.自身の経歴
医療系データの扱った経験のみに着目して、私の経歴をまとめると以下の通りです。
【業務経験】
治験の統計解析(約8ヶ月)
臨床研究の統計解析(約2ヶ月)
RWDの統計解析(多分1ヶ月)
医療費分析(約4ヶ月)
【ハードスキル歴】
SAS:1年ぐらい(研修期間含め)
Python:4ヶ月
治験や臨床研究の統計解析業務について、国のルールとしてSASを使用するようにと定められているため、SASで解析を行っています。
一方でRWDや医療費分析は特に定められておらず、SAS、Python、SQL、Rでも問題ありません。
アサインされたメンバーの都合でRWDの統計解析はSASを使用し、医療費分析の案件ではPythonを使用しました。
2.統計解析業務で何をやるのか
統計解析業務では大きく分けると2つに分けられます。
解析用データセット作成
解析帳票作成
解析用データセットの作成について、仕様書に沿って作成を行います。医薬品開発における統計解析ならではの話になりますが、治験の統計解析を行う場合にはCDISCという世界標準の仕様があり、それに則って仕様書と解析用データセットを作成する必要があります。
その一方で臨床研究ではCDISCに則って作成する必要はありません。
解析帳票の作成はレイアウトと統計解析計画書を確認しながら、解析帳票を作成していきます。
レイアウトには各帳票における出力項目や値や文字等の表記の仕方などが書かれており、帳票の見本のようなものです。
統計解析計画書には解析する上で必要なルールや注意事項、評価時点の取り扱いなどが記載されております。
解析用データセット作成も解析帳票作成も品質という観点から、どちらもダブルプログラミングを実施することが求められます。
2人のプログラマーが作成した解析用データセットや解析帳票を照合して一致しているかどうか確認します。
一致すれば解析用データセットは作成完了となり、解析帳票については第三者や生物統計に詳しい方による検証作業を行い、問題がなければ納品準備を進めていきます。
納品作業として帳票をPDF化して、文字切れチェックや見た目がおかしくないか確認していきます。
一致しない場合には結果を比較し、相手と自分が間違っていることを確認して修正点を洗い出し、必要に応じて相手に修正依頼します。
相手が何十年解析業務を行っている方でも間違っていることはあるので、経験が浅くてもレイアウトや仕様書、解析計画書を確認した上で指摘することが求められます。
ダブルプログラミングではペア同士で質問することはNGとなっており、質問事項があれば基本的に解析窓口担当者(IT業界でいうとPLに近い)に相談することになっていますが、場合によっては同じ案件にアサインされている第三者の方に相談することもあります。
納品後に依頼者様から追加解析の依頼があった場合には、既存の解析用データセットや解析帳票のプログラムに対して変数や処理を追加したり、修正したりします。
3.統計解析業務で身につくスキル
個人的に統計解析業務で身につくスキルは以下の通りです。
SASによるプログラミング
統計学(臨床に特化したもの)
ドメイン知識※
データ分析・解析の流れや作法※
当然ではありますが、SASによるプログラミングは1年間ぐらい取り組んでいくと独力でADSや解析帳票作成するところまでいけます。
統計学の知識について、統計検定2級程度の知識は必要だと考えてます。
もちろんSASでコード数行かけば検定や推定を行うことはできますが、検定や推定は何のために行っているのか概要を理解しておくと、自分自身の解析結果やプログラムについて間違いに気づきやすくなったり、解析計画書やレイアウトにある用語の理解がしやすくなったりして、作業しやすくなるなと実感しました。
※について、正直自分でどこまでキャッチアップするかにもよります。
それは業務の一環で必ず読む治験実施計画書をどこまで読み込むか次第になります。
私は以下のポイントで読んで、わからないところは本やサイトで調べて業務上わからないとよくないところを理解するようにしてました。
この試験の目的と試験デザイン
解析対象(除外や適格外なども)
疾患について
評価指標について
解析する上での留意事項
評価時点の取り扱い
これらに目を通すことで、データ分析・解析の流れや作法を抑えることはできたのかなと感じているので、今後業務に活かしていきたいです。
一方でドメイン知識について、臨床試験でよく出てくる用語は抑えられたと思いますが、詳しい薬の作用機序や薬物動態等の専門知識はついていないです。
ということで、本当に自分でどこまでやるか次第ではAIやBIに取り組むための土台づくりは行えたと感じてます。
4.最後に
統計学に興味ある方はぜひこちらの記事もご覧ください!
個人的には有意確率に関する記事がおすすめです!
ここまでお読みいただき、ありがとうございました!
この記事が少しでも参考になりましたら「スキ」を押していただけると幸いです!
株式会社分析屋について
弊社が作成を行いました分析レポートを、鎌倉市観光協会様HPに掲載いただきました。
ホームページはこちら。
noteでの会社紹介記事はこちら。
【データ分析で日本を豊かに】
分析屋はシステム分野・ライフサイエンス分野・マーケティング分野の知見を生かし、多種多様な分野の企業様のデータ分析のご支援をさせていただいております。 「あなたの問題解決をする」をモットーに、お客様の抱える課題にあわせた解析・分析手法を用いて、問題解決へのお手伝いをいたします!
【マーケティング】
マーケティング戦略上の目的に向けて、各種のデータ統合及び加工ならびにPDCAサイクル運用全般を支援や高度なデータ分析技術により複雑な課題解決に向けての分析サービスを提供いたします。
【システム】
アプリケーション開発やデータベース構築、WEBサイト構築、運用保守業務などお客様の問題やご要望に沿ってご支援いたします。
【ライフサイエンス】
機械学習や各種アルゴリズムなどの解析アルゴリズム開発サービスを提供いたします。過去には医療系のバイタルデータを扱った解析が主でしたが、今後はそれらで培った経験・技術を工業など他の分野の企業様の問題解決にも役立てていく方針です。
【SES】
SESサービスも行っております。