見出し画像

【理学療法士】今日から始めるSQL

大学院で学んだ公衆衛生学・疫学の知見を元に、健康的な社会を作りたい理学療法士のジローです。

臨床研究のバックグラウンドが疫学ということもあり、今年度からは、医療リアルワールドデータ活用人材育成事業東京大学履修証明プログラムに参加させていただいています。

■  医療リアルワールドデータ(Real-World Data, RWD)とは?


臨床試験や研究室のような制御された環境ではなく、実際の医療現場や日常生活の中で収集された健康関連のデータを指します。

これは、医療機関や患者の日常の診療、医療サービスの提供、健康管理の過程で生じるデータです。


具体的には、

  • 電子カルテ:病院やクリニックで管理される患者の診療記録。

  • レジストリーデータ:特定の疾患や治療に関するデータを集めたデータベース。

  • 保険請求データ:医療費請求の際に収集される情報。

  • ウェアラブルデバイススマートフォンなどで得られる健康管理データ。

  • 患者報告アウトカム:患者自身が報告する健康状態や生活の質に関するデータ。

などを指します。これらの解析を目的としたトレーニングを積んでいます。

約1ヶ月の夏休みが終わり、本格的に授業が再開しました。


さっそくSQLの演習が始まりました。


■  SQL(Structured Query Language)とは?


リレーショナルデータベースを操作するための標準的なプログラミング言語です。

※リレーショナルデータベースは、テーブル形式でデータを管理し、複数のテーブル間で関連付けを持たせることができるデータベースです。


以前、他の記事で示したような、ざっくりこんな感じのデータです。↓↓

idと各項目に情報が関連づけられてあります。
また、Excelでいうところの1枚のsheetに全ての欲しい情報があるわけではありません。
情報をまとめて解析できる形に形成します。


RWDの解析では、びっくりするような大きいデータを取り扱います。

SQLを使うことで、膨大なデータベースの中にある情報を引っ張ってきて、解析できる形までにすることが効率的にできるようになるということです。

ただの理学療法士…。

SQLの本当に、本当に簡単なことすらできません。ここに入るまで言葉すら知りませんでした。

GW明け(5月ごろ)に、SQLを少し触る機会があり、少しできた気になっていましたが、手を動かしてコードを書いていないと忘れてしまいます。

夏休みの間に、完全に初期化。

今回の演習ではエラーばかりで…(涙)。


■  SQLの演習ができるサービスを発見


コードを書く練習がしたくとも、なかなかその環境がありません。

その痒いところに手が届くサービス↓↓

SQLab

左側にSQLを書いて、再生ボタンを押すと、すぐに右側に書いた出力が出るのが嬉しいですね。内容も、私にも出来る程度の簡単内容からなので助かります。

全く予備知識なしでは、ここの初級編でも歯が立たないので、一応の学習は必要と思います。

↓↓  私は、この本で勉強しています。

今後、大きなデータを取り扱ってみたいと思っている人、SQLの勉強はいかがですか?

私も、データクリーニングを、R(tidyverse)、Python、SQLのどれを使っていこうか迷っています。まだまだ初学者なので、あまり好き嫌いをせずに雑食で勉強していこうと思っています。

いいなと思ったら応援しよう!