【積読中】論文を「読む」ための医療統計⚕️
文献の探し方から最新のベイズ統計・AI解析まで
はじめに
EBM (Evidence Based Medicine)
①インパクトファクターが高い医学雑誌:NEJM(ニューイング)、Lancet(ランセット)
②医学論文を読むためには、統計学の他に、疫学リテラシー(臨床研究デザインなど)も必須
③ランダム化比較試験RCT(介入研究)とコホート研究(観察研究)
④新しい解析手法:ベイズ統計、機械学習
⑤https://www.medicalview.co.jp/catalog/ISBN978-4-7583-1774-0.html
Part1 何の論文を読めばいいの?
クリニカルクエスチョン(CQ)は漠然としているため、リサーチクエスチョン(RQ)に落とし込む
RQをPICOに分解する
・Patients、Population、Problem
・Intervention(介入研究の場合)/Exposure(観察研究の場合)
・Comparison
・Outcome:最終的な患者の状態や結果、測定が容易で明らかに判る場合はhard outcome
P:糖尿病患者
I:SGLT2阻害薬の投与
C:プラセボの投与
O:eGFRの低下、アルブミン尿の増加
臨床研究デザイン(Study Design)の種類
介入研究は介入(治療)を行うが、観察研究は介入(治療)を行わない
介入研究(PICO)
・ランダム化比較試験(RCT)
・クロスオーバー試験
・前後比較研究
観察研究(PECO)
・時間を考えない研究
・横断研究
・時間を考える研究
・コホート研究
・レトロスペクティブ研究(ケースコントロール研究、症例対照研究)
・その他
・症例報告
・症例集積研究
介入研究(PICO)
疾患や状態などの因子に対する介入が、疾患の発症予防や治療等に効果があるかを調べる研究
ランダム化比較試験(RCT, Randomized Controlled Trial)
・患者間比較(投薬有無の比較)が目的
・比較する2群
①新薬を投与した群
②プラセボを投与した群
クロスオーバー試験
・患者内比較(投薬前後の状態の比較)が目的
・比較する2群:時期効果と持ち越し効果を考慮して以下を用意する
①新薬を投与した後(ウォッシュアウト期間後)にプラセボを投与した群
②プラセボを投与した後に新薬を投与した群
観察研究(PECO)
治療などの介入を行わず、ある疾患の患者を長期間観察することや、既に行なわれている治療の効果のデータを収集することで、疾患の特徴を捉える研究
時間を考えない研究
・横断研究:国勢調査など、1回のみ調査する研究、因果関係を捉えることはできない
時間を考える研究
・コホート研究:RCTとは異なり、比較対象の背景を合わせない(そのため多変量解析を使ぬてバイアスを避ける)
・前向きコホート研究:現在から未来に追跡
・後ろ向きコホート研究:過去から現在に追跡
・比較する2群:曝露群/非曝露群
・レトロスペクティブ研究(ケースコントロール研究、症例対照研究)
・現在から過去に追跡(現在疾患ありの患者が過去にどんな因子に曝露されたのか?):後ろ向きコホート研究との違いに注意する
・比較する2群:症例群(ケース群)/対照群(コントロール群)の比較
その他の研究
・症例報告:稀な疾患の患者をひとり追跡し続ける
・症例集積研究:稀な疾患を数名まとめて特徴を見つける
Part2 文献を探しましょう
背景質問(Background Question):教科書を調べれば答えが書いてある
前景質問(Foreground Question):リサーチクエスチョンのこと
医学情報ソースの6S
①System:最も信頼性が高い情報源
②Summary:UpToDateなど
③Synopses of syntheses:システマティックレビューの要約
④Synthesis:システマティックレビューのこと、The Cochrane Libraryなど
⑤Synopses of single studies:高品質な論文の要約または抄録が載った雑誌
⑥Single studies:原著論文のこと
システマティックレビューとメタアナリシス
考え方
・アウトカムが異なる研究をまとめて扱うことはできないため、論文はアウトカムごとに分類する必要がある
昔は、研究デザインのみを考慮して、エビデンスレベルを判定していた
そのため、試験中に脱落者が多発するような試験でもエビデンスレベルが高くなる場合があった
これを受けて、システマティックレビューとメタアナリシスをエビデンスレベルとは分離して考えることにした
ナラティブレビュー
自分の論文に好都合な論文のみを恣意的に集められてしまう方法
システマティックレビュー
ナラティブレビューの恣意性を減らすために統一的な方法論を使う
・漏れなく論文を参照する
・中立的な基準で論文を評価する
システマティックレビューの流れ
①CQの立案
②文献検索:数千件の論文が残る
③1次スクリーニング(アブストのみ読む):数百件の論文が残る
④2次スクリーニング(原本を精読する):レビュー対象論文のみを残す
⑤エビデンスのまとめ
⑥結果の解釈
メタアナリシス
システマティックレビューの際に収集した論文を統計学的にまとめて解析すること
メタアナリシスが行えるほど論文が発表されていないRQもあるため、その場合にはメタアナリシスが行えない
まずはシステマティックレビュー(SR)によって、CQに関係する全ての論文を網羅的に収集する
次に、メタアナリシス(MA)により、SRで良質な研究結果を複数集めて統合する(garbage in garbage outに注意)
システマティックレビューについてのガイドライン
PRISMAチェックリスト
論文の検索エンジン
PubMed®️
Embase®️
Cochrane Library
Google Scholar
医中誌Web
医学中央雑誌刊行会
シソーラス(用語集)
MeSH(Medical Subject Headings)
Part3 ランダム化比較試験
1 ABSTRACTと論文の構成
2 臨床試験の倫理指針
3 治験のphaseとは何か?
4 CONSORT声明を押さえる
5 日本語の抄録を読んでもいい?
6 INTRODUCTION(序)を読む
7 METHODSを読む ① TRIAL DESIGN AND OVERSIGHT
8 METHODSを読む ② PATIENTS
9 METHODSを読む ③ TRIAL PROCEDURES
10 METHODSを読む ④ OUTCOMES
11 METHODSを読む ⑤ STATISTICAL ANALYSISとRESULTS
12 RESULTSを読む ① 患者背景をデータの分析で理解する
13 RESULTSを読む ② アウトカムのリスクを把握する
14 RESULTSを読む ③ 生存曲線の読み方
15 RESULTSを読む ④ ハザード比と95%信頼区間って?
16 RESULTSを読む ⑤ p値の解釈
17 RESULTSを読む ⑥ サブグループの結果を読む
18 DISCUSSIONを読む
Part4 コホート研究
1 STROBE声明を押さえる
2 論文の目的を探る
3 研究デザインを確認する ① 因果関係に注意
4 研究デザインを確認する ② バイアスを押さえる
5 研究デザインを確認する ③ 交絡を考える
6 INTRODUCTIONとMETHODSを読む
7 ロジスティック回帰モデル ① 2群の比較「t 検定」を押さえる
8 ロジスティック回帰モデル ② 3群の比較「一元配置分散分析」を押さえる
9 ロジスティック回帰モデル ③ 回帰直線を押さえる
10 ロジスティック回帰モデル ④「 多変量解析」を押さえる
11 ロジスティック回帰モデル ⑤ オッズ比の求め方と解釈
12 STATISTICAL ANALYSISを読む ① 欠測値の扱い
13 STATISTICAL ANALYSISを読む ② ロジスティック回帰分析
14 RESULTSを読む
ロジスティック回帰分析
・ロジスティック曲線(S字曲線、二値を取る確率分布)をロジット変換して直線に直してから回帰分析する方法のこと
・普通の回帰分析と同じように、予測式としても使える
・ロジスティック単回帰分析とロジスティック重回帰分析がある
Part5 傾向スコア
1 傾向スコアを使う研究デザイン
2 傾向スコアの求め方,使い方
3 傾向スコアの手法を読む ① マッチングの仕方
4 傾向スコアの手法を読む ② マッチング前後の背景因子バランス
5 傾向スコアの手法を読む ③ マッチングを考慮した比較
6 傾向スコアの手法を読む ④ Cox比例ハザード回帰モデル
生存時間分析
・Kaplan-Meier曲線
・Cox回帰モデル
Part6 ベイズ統計
1 ベイズ統計を使う研究デザイン
2 ベイズ統計学を知る ① 感度・特異度を復習
3 ベイズ統計学を知る ② ベイズの定理
4 ベイズ統計学を知る ③ ベイズ更新
5 ベイズ統計学を知る ④ 事前確率を連続変数として考える
6 ベイズ統計学を知る ⑤ 事後分布の関数の形を求める
7 ベイズ統計学を知る ⑥ マルコフ連鎖モンテカルロ法(MCMC)
8 ベイズ統計学を知る ⑦ Stanを使ったMCMCの計算
9 METHODSを読む
10 RESULTSを読む
Part7 人工知能
機械学習の3分類
教師あり学習
教師なし学習
強化学習
アンサンブル学習
精度が低いモデル(弱学習器)でも、複数組み合わせることで精度を高くできる
ニューラルネットワーク
パーセプトロン
・神経回路網を数理モデル化したもの:通常、3層(入力層→中間層→出力層)で構成される
・活性化関数:シグモイド関数、tanh関数、ソフトマックス関数、ReLU
最適化アルゴリズム(Optomizer)
・損失関数(予測値と正解値の差)を最小にするためのアルゴリズム
・例
・勾配降下法:局所的最適解に嵌らずに、大域的最適解を探し出す
再学習
・転移学習:既存の学習済みモデルの一部をそのまま使う、新たに追加した部分のデータのみ学習する
・ファインチューニング:既存の学習済みモデルの一部と、新たに追加したモデルを合わせて全体の微調整を行う
誤差逆伝播法(Back Propagation)
・勾配消失問題
深層学習
・中間層がたくさんあるパーセプトロン
代表的な深層学習モデル
・CNN(畳み込み、Convolutional)
・例:LeNet、AlexNet
・時系列データの解析には向かない
・RNN(再帰型、Recurrent)
・時系列データ(自然言語、天気、株価、など)の解析に向く
・LSTM:長期の過去データも使用できるモデル
・GRU:LSTMを単純化したモデル
・GAN
実際に論文を読んでみよう
研究デザイン:retrospective study
5 実際に論文を読んでみよう! ① ABSTRACTを読む
6 実際に論文を読んでみよう! ② METHODSを読む
7 実際に論文を読んでみよう! ③ 深層学習モデルを把握する
8 実際に論文を読んでみよう! ④ RESULTSを読む
完
補足
臨床研究手法の選び方
コホート研究とレトロスペクティブ研究
字義的なレトロスペクティブの対義語はプロスペクティブなのだが、ここではコホート研究の対義語としてレトロスペクティブ研究という語彙を使う
(コホート研究のなかに前向き/後ろ向きprospective/retrospective cohort studyという表現が出てきて混乱する)
コホート研究:リスク比を使う
レトロスペクティブ研究:オッズ比を使う
例えば、喫煙と肺がんの関係を研究する場合
・前向き研究:現在、喫煙歴のある群/ない群について、その後、肺がんが発症するかどうかを追跡する
・後ろ向き研究:現在、疾患のある群/ない群について、喫煙暦の有無を調査する
※疫学調査には後ろ向き研究が多い:前向き研究は時間もコストも掛かるし、場合によっては倫理的な問題も起こりうる(喫煙者に禁煙を許さないなど)ため
前向き研究なら、リスク要因以外の条件を統制すれば良いので、単純にリスク要因を抱えている人と(医学では曝露という言葉を使います)、ない人の発症率の差(リスク差)や発症率の比(リスク比、相対リスク)から、リスク要因の影響を評価できます。
これに対し、後ろ向き研究ではリスク差やリスク比を使わず、オッズ比(odds ratio、OR)というものを求めます。
リスク比(相対危険度)とオッズ比
・リスク比(RR)
・オッズ比(OR)
リスク比
・分子:肺がんを発症した者/喫煙歴あり全員
・分母:肺がんを発症した者/喫煙歴なし全員
オッズ比
・分子:(喫煙歴あり∧肺がん発症)/(喫煙歴あり∧肺がん未発症)
・分母:(喫煙歴なし∧肺がん発症)/(喫煙歴なし∧肺がん未発症)
数式的には異なるリスク比・オッズ比をどう使い分けるか?
・リスク比が3の場合は、「喫煙者は、非喫煙者に比べて、肺がんを発症するリスクが3倍である」と解釈できる
・オッズ比が3の場合は、「喫煙者は、非喫煙者に比べて、肺がんの発症しやすさが3倍である」とは解釈できない
なぜ解釈しにくいオッズ比が使われているのか?
・ロジスティック回帰分析との相性が良い:医療統計ではロジスティック回帰分析を多用するため、結果的にオッズ比も多用される
・コホート研究でもケースコントロール研究でも使える:コホート研究ではリスク比もオッズ比も使えるが、ケースコントロール研究ではリスク比が使えない
・イベント発生確率pが小さければ、オッズ比はリスク比の近似になっている
歴史的背景
オッズは、ギャンブルの世界で儲けを表す指標だった
・賭ける対象のオッズが3なら、勝った時の儲けは賭け金の3倍、1/3なら賭け金の1/3倍
医療統計ではこれを拡張して、
・オッズ = イベントが発生した人数 / イベントが発生しなかった人数
と定義した
イベントとは疾患を意味している
疫学調査の研究デザインとしては、後ろ向き研究(レトロスペクティブ、ケースコントロール、症例対照)が多い
何故ならば、特に罹患率の低い疾患の場合、前向き研究(プロスペクティブ、コホート)を行おうとすると疾患が発生するまで長期間にかかるため
しかし、レトロスペクティブ研究は比較的容易な一方で、リスク比という考え方が使えない
オッズ比には、イベント発生確率pが低い場合(罹患率が低い疾患の場合)、リスク比と近い値になるという特徴があるため、リスク比の近似値としてレトロスペクティブ研究で使われてきた
定義式としては、イベント発生確率pが高くてもオッズ比を算出できるが、その場合はもはやリスク比とはかけ離れてしまう
そのため、言葉遣いの問題として、オッズ比の値を使ってリスクに言及することは避けるべき
実務的には、研究デザインによらず、オッズ比は濫用されている
特にアウトカムが二値変数(疾患の有/無、生存/死亡、など)の場合によく使われている
理由は、純粋に数学的に扱いやすいからである
・反イベントのオッズ比を算出したい場合、逆数を取るだけで済む:死亡オッズ=1/生存オッズ
・オッズ比の取り得る値は±∞で、メタアナリシス時に比較しやすい:リスク比の取り得る値は一定幅(シーリング効果)で比較しにくい(コホート毎に幅がバラバラになってしまう)
・オッズ比の回帰モデル(=ロジスティック回帰モデル)は計算しやすくp値が安定している:リスク比の回帰モデルでp値を安定させるには計算が難しい(サポートしてないツールも多い)
使ってもいいが、解釈を間違えないように注意
オッズ比でリスクの「倍率」を主張することはできない(リスクが増える/減ることだけなら主張できる)
リスク比は、症例数(疾患ありの人/疾患なしの人をそれぞれ何人調べるか)によって値が変わってしまう
レトロスペクティブ研究(ケースコントロール)の場合、症例数を何人集めて研究対象にするかは研究者の自由で選べるため、リスク比の値も恣意的に操作できてしまう
(オッズ比の場合は、それぞれが何人いても同じ値になる)
・割合(リスク):最大値は1(0〜100%)
・オッズ:1を超える場合あり
割合とオッズは、どちらかが既知ならもう片方も算出できる:割合=オッズ/(オッズ+1)
ロジスティック回帰分析の結果:Exp(B)
・オッズ比が1より大きい場合、Xの増加につれて割合も大きくなり、オッズ比が大きいほど割合変化カーブは急激になる