見出し画像

COVID19関連ARDS;延長伏臥位(24時間以上)と標準伏臥位(16~24時間)逆確率重み付け(IPTW)比較 差は認められず 体位変換繰り返しは一体何だったんだろう?


COVID-19感染の最盛期、まるでprone positioningしなけりゃ悪であるとされたが、仰臥位を含めた医療を行い、人的資源負担は相当なものであった。
一応、延長伏臥位(24時間以上)と標準伏臥位(16~24時間)の持続時間を比較した報告。RCTできないため、逆確率重み付け(IPTW)Cox回帰モデルまたはFine-Gray回帰モデルを用いた研究であるが、延長伏臥位はスタッフの作業負担を減らす可能性があり、結果が悪化しない限り、実践面での利点があるのかもしれない

Hochberg, Chad H., Elizabeth Colantuoni, Sarina K. Sahetya, Michelle N. Eakin, Eddy Fan, Kevin J. Psoter, Theodore J. Iwashyna, Dale M. NeedhamとDavid N. Hager. 「Extended versus Standard Proning Duration for COVID-19–Associated Acute Respiratory Distress Syndrome: A Target Trial Emulation Study」. Annals of the American Thoracic Society 21, no. 10 (2024年10月): 1449–57. https://doi.org/10.1513/AnnalsATS.202404-380OC.

【根拠 】:中等度から重度の急性呼吸窮迫症候群(ARDS)において、16時間以上の伏臥位(ふくがい、うつぶせ)管理は生存率を改善する。しかし、伏臥位の最適な持続時間は不明である。

【目的 】:中等度から重度の新型コロナウイルス感染症(COVID-19)ARDS患者において、標準的な伏臥位の持続時間と比較して延長された伏臥位持続時間の効果を推定すること。

【方法 】:5つの病院の電子カルテデータベースからデータを抽出した。機械的人工呼吸開始後72時間以内に伏臥位が行われた患者を、最初の伏臥位施行時間に基づき、延長群(24時間以上)と標準群(16〜24時間)に分類した。延長群と標準群の90日間死亡率という一次アウトカムおよび人工呼吸器からの離脱、集中治療室(ICU)からの退室という二次アウトカムに対する効果を推定するために、ターゲット試験模倣デザインを使用した。分析には、治療の逆確率重み付け(IPTW)Cox回帰モデルまたはFine-Gray回帰モデルを用いた。

【結果 】:合計314人の患者が対象となり、234人が延長伏臥位、80人が標準的な伏臥位を受けた。延長伏臥位を受けた患者は、年齢が高く、併存症が多く、学術病院での治療が多く、入院から人工呼吸開始までの時間が短かった。IPTW後、患者の特徴はよく均衡した。延長伏臥位群と標準伏臥位群の未調整90日間死亡率はそれぞれ39%と58%であった。二重ロバストIPTW分析では、延長伏臥位と標準伏臥位の持続時間が死亡率に有意な影響を与えることは確認されなかった(ハザード比[95%信頼区間]、0.95 [0.51–1.77])。人工呼吸器離脱(サブディストリビューションハザード、1.60 [0.97–2.64])およびICU退室(サブディストリビューションハザード、1.31 [0.82–2.10])にも有意な効果は見られなかった。

【結論 】:ターゲット試験模倣デザインを使用した結果、延長伏臥位と標準伏臥位の持続時間が死亡率、人工呼吸器離脱、またはICU退室に与える有意な影響は確認されなかった。しかし、推定の不正確さを考慮すると、さらなる研究が正当化される。

【キーワード 】:急性呼吸窮迫症候群;伏臥位管理;ターゲット試験模倣;新型コロナウイルス感染症2019


序文要約

  • 伏臥位は中等度から重度の急性呼吸窮迫症候群(ARDS)患者の死亡率を低下させる。

  • 新型コロナウイルス感染症(COVID-19)パンデミックにより、伏臥位換気が広く採用されたが、伏臥位の持続時間には大きなばらつきがあり、24時間以上継続することもあった。

  • 伏臥位は、肺保護換気を促進し、肺に均等な圧力をかけることで肺胞の膨張を均一化し、アウトカムを改善すると考えられている。

  • 延長した伏臥位は、肺保護換気の効果を最大限に活用し、体位変換の回数を減らし、デバイスの外れやスタッフの負担を減少させる可能性がある。

  • 一方で、延長した伏臥位は、圧迫や神経筋障害、栄養不耐性などのリスクを増加させる。また、人工呼吸器サポートや鎮静、神経筋遮断の縮小が遅れる可能性がある。

  • 延長伏臥位が安全に実施可能であることを示すデータはあるが、患者のアウトカムへの影響は十分に確立されていない。

  • ランダム化比較試験(RCT)が行われれば、延長伏臥位の有益性が確認される可能性があるが、そのような試験は計画されていない。

  • RCTがない場合、観察データを用いたターゲット試験模倣が治療効果を推定するために有効な方法であり、これまでに成功例がある。

  • 本研究では、中等度から重度のCOVID-19 ARDS患者における延長伏臥位と標準伏臥位の効果を推定し、延長伏臥位が死亡率の低下や人工呼吸器からの早期離脱、ICU退室の短縮に関連すると仮定した。


研究方法:

  • データ源:ボルチモア・ワシントンD.C.地域にあるジョンズ・ホプキンス医療システム(JHHS)の5つの病院(2つの大学病院と3つの地域病院)の電子カルテ(EMR)データを使用した。

  • コホートの特定:2020年3月から2022年12月までにCOVID-19で機械的人工呼吸管理を受けた患者のコホートを特定した。

  • 研究デザイン:延長伏臥位(24時間以上)と標準的な伏臥位(16~24時間)の持続時間を比較する仮想的な試験を設定し、この後ろ向き観察コホートを用いてターゲット試験模倣を行った。

  • 対象患者の選定

    • 18歳以上の成人患者。

    • 機械的人工呼吸開始後72時間以内に伏臥位が行われた。

    • 伏臥位開始前24時間以内に、PaO2/FiO2が150 mmHg以下かつFiO2が0.6以上であった(PROSEVA試験に準拠)。

    • PaO2が測定されていない場合、検証済みの方法でSpO2から値を推定した。

  • 除外基準

    1. 入院時に気管切開があった患者。

    2. JHHS外で機械的人工呼吸が開始された患者。

    3. 伏臥位開始後24時間以内に死亡、他の病院へ転院、またはECMOが開始された患者。

    4. 最初の伏臥位セッションが16時間未満であった患者。

    5. 適格時に「救急」換気モード(例:気道圧解放換気)を受けていた患者。

  • 治療戦略の比較:延長伏臥位(24時間以上)と標準伏臥位(16~24時間)の持続時間を比較した。

  • 最初のセッションに焦点を当てた理由

    1. ARDS初期に伏臥位の最大の効果が期待できるため。

    2. RCTにおいて、後続の伏臥位セッションの持続時間を規定することは困難であるため。

  • 伏臥位のタイミングと持続時間の決定:看護および呼吸療法のフローチャートを用いて患者の体位を正確に記録し、それに基づいて決定した。

  • JHHSのガイドラインとプロトコル

    • COVID-19重症疾患のガイドラインでは、少なくとも18~24時間の伏臥位セッションを推奨していた。

    • 24時間を超えて伏臥位を継続することを規定したプロトコルはなかった。

    • COVID-19以前の伏臥位の実践は、より短い持続時間であった。

  • ランダム化の模倣:伏臥位16時間目でのランダム化を模倣するために、逆確率重み付け(IPTW)を使用した。

  • 傾向スコアモデルの共変量:年齢、性別、非白人、人種、BMI(正常体重、肥満、極度の肥満)、Charlson併存疾患指数、非呼吸器SOFAスコア、伏臥位開始前24時間の最低PaO2/FiO2、伏臥位によるPaO2/FiO2の変化、時間加重平均PEEP、駆動圧、一回換気量、ノルエピネフリン用量、病院、伏臥位16時間目の時刻、研究月を含めた。

  • 欠測データの処理:PaO2/FiO2が欠測の場合、代替の時間帯のデータを使用した。非線形性を考慮するため、研究月は制限付き立方スプラインでモデル化した。

  • 傾向スコアモデルの選択:ロジスティック回帰、一般化ブースティングモデル、共変量バランス傾向スコア(CBPS)を評価し、共変量バランスが最も良好なCBPSを選択した。

  • 一次アウトカム:90日目までの死亡までの時間。

  • 二次アウトカム

    1. 90日目までの生存しての機械的人工呼吸器からの離脱までの時間(48時間以上オフ)。

    2. 90日目までの生存してのICUからの退室までの時間(24時間以上オフ)。

  • アウトカムの時間ゼロ:最初の伏臥位開始後16時間目とした。

  • 統計解析

    • ベースライン特性は中央値と四分位範囲、または数と割合で記述し、IPTW前後で絶対標準化平均差または比率差を用いて比較した。

    • 一次アウトカムには、CBPSモデルからの安定化重みとロバストな標準誤差を用いた重み付きCox回帰を使用した。

    • 二重ロバスト性を確保するため、傾向スコアモデルの共変量をアウトカムモデルにも含めた(「ランダム化」の時刻は除外)。

    • 二次アウトカムには、死亡の競合リスクを考慮したIPTW Fine-Gray比例ハザードモデルを使用した。

  • 欠測データの処理:4つの変数に欠測があり、多重代入法を用いて15の完全データセットを作成し、Rubinのルールに従って結果を統合した。

  • 感度分析:結果の頑健性を評価するため、事前に規定した以下の感度分析を行った。

    1. 異なる傾向スコアモデル(ロジスティック回帰、一般化ブースティングモデル)の使用。

    2. 重み付けなしの多変量回帰解析。

    3. 完全症例解析。

    4. コホート定義を緩和した解析(例:人工呼吸開始後最大7日までに伏臥位となった患者を含む)。

    5. 標準的な伏臥位を12~24時間と再定義した解析。

    6. 大学病院または地域病院で層別化した重み付けなしの多変量解析。

  • 倫理的承認と報告基準

    • 本研究はジョンズ・ホプキンス大学医学部の倫理審査委員会の承認を受け、二次データ解析のための同意免除が認められた(IRB00280745)。

    • 研究報告は、観察研究の報告を強化するためのガイドライン(STROBE)に従った。

  • データ解析:Rソフトウェア(バージョン4.3.1)の「MatchThem」および「Survival」パッケージを使用して解析を行った。


結果

  • 対象患者数:5つの病院、15のICUにおいて、314人の患者が含まれた(うち234人が延長伏臥位、80人が標準伏臥位を受けた)。

  • データ補完:6人の患者(2%)は事前の動脈血ガス測定がなく、SpO2からPaO2/FiO2を推定した。

  • 基礎特性の不均衡:IPTW前に、年齢、Charlson併存疾患指数、Vt/PBW、PaO2/FiO2の変化、治療を受けた病院(大学病院か地域病院か)、機械的人工呼吸開始までの時間で最大の不均衡が見られた。

  • IPTW後のバランス:全ての変数で適切なバランスが取れており、BMI以外の変数は全て許容範囲内であった。

  • 伏臥位の持続時間:延長伏臥位群は最初の伏臥位持続時間が長く(中央値45時間 vs 19時間)、全セッションの平均持続時間や総伏臥位時間も長かったが、セッション回数は少なかった。

  • 生存率:90日間の死亡率は、未重み付けで延長群が39%、標準群が58%。IPTW後では、それぞれ39%と47%。

  • 重み付け後の結果:IPTWを用いた二重ロバストなCox回帰解析では、90日間の生存率に有意な差は見られなかった(ハザード比0.95, 95% CI 0.51–1.77)。

  • 二次アウトカム:死亡の競合リスクを考慮した解析でも、人工呼吸器からの離脱やICU退室までの時間に有意な差は見られなかった。

  • 感度分析:統計的手法やコホート定義を変えた感度分析でも、死亡率とICU退室に関して同様の結果が得られた。

  • 追加の発見:コホート定義を緩和した解析では、人工呼吸器からの早期離脱に対する有意な効果が見られた(例:16–24時間または12–24時間の標準伏臥位定義を使用)。


Definition of abbreviation: ICU = intensive care unit. Data are presented as n (%), %, or median (interquartile range). * Those who were dead by day 90 were assigned 0 days.


略語の定義:CI = 信頼区間(confidence interval);ICU = 集中治療室(intensive care unit);IPT = 治療の逆確率重み付け(inverse probability of treatment);HR = ハザード比(hazard ratio);sHR = サブディストリビューションハザード比(subdistribution hazard ratio)。 HRは、重み付けされた二重ロバストCox比例ハザードモデルから計算されたもの。sHRは、死亡の競合リスクを考慮したFine-Gray法の重み付け実装に基づいて計算されたもの。 † HRは1.0を超える値である場合、死亡までの時間が短いことを意味する。sHRは1.0を超える場合、人工呼吸器からの離脱またはICU退室までの時間が短いことを意味する。


図2. 生存率、人工呼吸器からの離脱までの時間、集中治療室(ICU)退室までの時間。主要アウトカム(90日間の死亡率)のKaplan-Meierプロットと、二次アウトカム(人工呼吸器からの離脱までの時間、ICU退室までの時間)の累積発生プロット。累積発生プロットは、死亡の競合リスクを考慮するためにFine-Gray法を使用して作成された。(A) 未重み付けの曲線。(B) 治療の逆確率重み付け後の曲線。



Discussion要約

  • 本研究では、314人の中等度から重度のCOVID-19 ARDS患者を対象に、延長伏臥位と標準伏臥位の持続時間が患者のアウトカムに与える影響をターゲット試験模倣で推定した。

  • 90日間の死亡率、人工呼吸器からの離脱までの時間、ICU退室までの時間について、延長伏臥位の有意な効果は確認されなかった。

  • 延長伏臥位が安全に実施可能であることを示す先行研究があるが、患者のアウトカムへの影響は明確に確立されていない。

  • 本研究と先行研究の結果が異なる理由には、研究デザインの違いが挙げられる。先行研究では、機械的人工呼吸開始後の任意のタイミングで伏臥位が実施されていたが、本研究では72時間以内に伏臥位を開始した患者に限定した。

  • 先行研究では標準伏臥位を12~24時間と定義していたが、本研究では16~24時間としており、これが結果に影響を与える可能性がある。

  • 延長伏臥位に対する期待を和らげる結果となったが、さらなる研究が必要である。

  • 感度分析において、延長伏臥位が人工呼吸器からの離脱を早める可能性が示されたため、この点についてのさらなる調査が求められる。

  • 延長伏臥位はスタッフの作業負担を減らす可能性があり、結果が悪化しない限り、実践面での利点があると考えられる。

  • 日常的な伏臥位の終了は、患者の治療の縮小(鎮静、神経筋遮断、人工呼吸器サポートの解除)を検討する機会となるが、リスクも伴う。

  • 将来的には、電気インピーダンス断層撮影や超音波などの画像技術を用いた研究が、伏臥位の最適な持続時間を明らかにするのに役立つ可能性がある。

  • 本研究の強みは、ターゲット試験模倣の使用とIPTWによるコホートのバランスが取れていること、詳細なデータの使用である。

  • 限界としては、後ろ向き観察研究であり、伏臥位の副作用(圧迫や神経筋障害)に関するデータを収集できなかった点が挙げられる。

  • 他の未測定の交絡因子の影響を排除できなかった可能性があり、研究結果は探索的なものと見なすべきである。

  • 延長伏臥位と標準伏臥位のRCTは現在進行中ではなく、本研究はこの分野において重要なバランスを提供し、さらなる研究の必要性を示している。

  • 延長伏臥位と標準伏臥位の定義を最初のセッションの持続時間に基づいて行ったが、これは臨床的に妥当であると考えた。

  • しかし、このアプローチにはバイアスが生じる可能性がある。

  • 24時間以内に死亡またはECMOが開始された患者を除外したため、本研究の対象は最も重症のARDS患者を代表していない可能性がある。

  • さらに、本研究の結果はCOVID-19 ARDS患者に限定されており、他の環境に一般化できるかは不明である。


「ターゲット試験模倣(target trial emulation)」とは、【実施されていないランダム化比較試験(RCT)を模倣して、観察データを用いて治療の有効性を推定する方法 】です。具体的には、観察研究のデータを利用して、RCTが行われたかのようにデザインし、できる限りバイアスを排除しながら因果推論を行うアプローチです。この方法は、倫理的・実践的理由でRCTが実施できない場合や、既に存在するデータを活用したい場合に有用です。

以下に、ターゲット試験模倣がどのように実施されるかを説明します。

  1. 【理想的なRCTのデザインを設定 】
    まず、仮想的に実施する理想のRCTを考え、その試験に必要な要素を設計します。これには以下が含まれます。

  • 【治療群と対照群の設定 】:どの治療や介入を比較するのか(例:延長した伏臥位 vs 標準的な伏臥位)。

  • 【被験者の選定基準 】:誰がこの仮想的試験に参加できるのか(例:中等度から重度のCOVID-19 ARDS患者)。

  • 【アウトカムの設定 】:どのような結果を測定するのか(例:死亡率、人工呼吸器からの離脱、ICU退室など)。

  1. 【観察データから対象患者を抽出 】
    理想的なRCTに基づいて、電子カルテなどの観察データから、仮想的なRCTの被験者となる患者を抽出します。ここでは、治療群に対応する患者と対照群に対応する患者を分け、治療を受けたかどうかに基づいて分類します。

  2. 【バイアスを減らすための調整 】
    観察データには、RCTとは異なり、治療がランダムに割り当てられていないため、【交絡因子(confounders) 】が存在する可能性があります。これを避けるために、次のような統計的手法を使用します。

  • 【逆確率重み付け(IPTW: Inverse Probability of Treatment Weighting) 】:各患者がどちらの治療を受けたかの確率に基づいて重みをつけ、治療群と対照群の特性を調整します。

  • 【マッチング 】:類似した特性を持つ患者同士をペアにする方法。

  • 【回帰モデル 】:交絡因子を調整するために用いる統計モデル。

  1. 【結果の解析 】
    治療群と対照群の間で、設定したアウトカム(例えば死亡率や人工呼吸器からの離脱までの時間など)を比較します。ここでの解析は、RCTと同様に、治療の因果効果を推定することを目指します。

  2. 【バイアスの評価 】
    ターゲット試験模倣では、観察研究の弱点である「不死時間バイアス(immortal time bias)」や「選択バイアス(selection bias)」などに特に注意します。これらのバイアスを減らすために、デザインや解析の工夫が行われます。

具体的な例
COVID-19のパンデミックにおける伏臥位の効果をRCTで調べるのが難しい場合、実際の臨床データから、どの患者がどのタイミングで伏臥位を受けたのかを観察データから抽出し、治療群と対照群に分けます。次に、IPTWや回帰モデルを使って交絡因子を調整し、実施されていないRCTを模倣して、延長伏臥位の効果を推定します。

ターゲット試験模倣は、観察データの限界を克服し、現実的な状況下で治療効果を推定するための強力な方法です。


「ターゲット試験模倣(target trial emulation)」と「傾向スコア補正(propensity score adjustment)」は、いずれも【観察データから治療効果を推定するために用いられる手法 】ですが、アプローチや目的にはいくつかの違いがあります。以下、それぞれの違いと類似点を説明します。

  1. 【基本的な違い 】

  • 【ターゲット試験模倣(target trial emulation) 】:

    • これは、【仮想的なランダム化比較試験(RCT) 】を設計し、そのRCTを模倣して、観察データを用いて治療の効果を推定する手法です。RCTが理想的にはどのようにデザインされるべきかを最初に考え、観察データをその理想に近づけるように解析を行います。

    • RCTのデザイン(例:患者選択基準、治療群の設定、アウトカムの測定方法など)に基づいて観察データを使用し、治療効果を推定します。

  • 【傾向スコア補正(propensity score adjustment) 】:

    • 傾向スコアとは、ある患者が特定の治療を受ける「【確率**」を示すスコアです。このスコアを計算するためには、年齢や併存疾患などの**交絡因子 】に基づいて、どの患者がどちらの治療を受ける可能性が高いかを推定します。次に、そのスコアを使って治療群と対照群を調整します。

    • 傾向スコアは、治療群と対照群の間で交絡因子を均衡させるために使われますが、RCTを模倣するという明示的な目標はありません。

  1. 【手法の目的 】

  • 【ターゲット試験模倣**の目的は、**理想的なRCTを模倣すること 】にあり、観察データの制約をできる限り解消し、因果関係を推定しようとします。この手法では、RCTでよく見られるバイアス(不死時間バイアスや選択バイアスなど)にも注意を払い、それらを最小限にするための工夫が行われます。

  • 【傾向スコア補正の目的は、観察研究における交絡因子を統計的に調整**することです。特に、治療の割り当てがランダムではなく、交絡因子が治療とアウトカムの両方に影響を与える可能性がある場合に、治療を受けた確率に基づいて患者を調整します。これは、**交絡バイアスを減らすため 】の手段です。

  1. 【使用する手法の違い 】

  • 【ターゲット試験模倣**では、**逆確率重み付け(IPTW: Inverse Probability of Treatment Weighting) 】のような手法をよく使います。IPTWは、各患者がどの治療を受けたかの確率に基づいて重みをつけ、治療群と対照群の特徴を均衡させます。これにより、非ランダム化された観察データであっても、仮想的にランダム化された試験のように扱うことが可能になります。

  • 【傾向スコア補正 】では、傾向スコアを使用して交絡因子を調整します。具体的には、以下の方法が使われます:

    • 【傾向スコアマッチング 】:治療群と対照群の患者を、傾向スコアに基づいてマッチング(ペアにする)する。

    • 【傾向スコアによる重み付け 】:IPTWのように、傾向スコアに基づいて重みをつけて解析する。

    • 【傾向スコアを共変量として回帰モデルに含める 】:傾向スコアを共変量として回帰モデルに組み込んで交絡の調整を行う。

  1. 【具体的なバイアスへの対応 】

  • 【ターゲット試験模倣は、特に不死時間バイアス選択バイアス 】などの、観察データに特有の問題を解消することに重きを置いています。不死時間バイアスは、例えば、治療を受けたグループが一定期間生存しなければ治療を受けることができない場合に発生しますが、ターゲット試験模倣ではこのバイアスを最小限にするための設計が行われます。

  • 【傾向スコア補正は、主に交絡バイアス 】の調整を目的としており、特定の治療を受ける可能性の高い患者の特徴が異なる場合に、それらを調整します。しかし、不死時間バイアスや選択バイアスに対しては、必ずしも適切に対応できないことがあります。

  1. 【どちらを選ぶべきか 】

  • 【ターゲット試験模倣 】は、理想的なRCTを実施できない状況で、RCTの結果を模倣することを重視します。観察データを用いて因果推論をする場合、この手法はより広範で強力です。

  • 【傾向スコア補正は、主に交絡因子の調整 】を目的としており、観察研究において治療群と対照群のバランスを取るために有用です。ただし、RCTの模倣を目指していない点が異なります。

結論
「ターゲット試験模倣」は、仮想的なRCTを再現することに重点を置いたアプローチであり、「傾向スコア補正」は、観察データの交絡バイアスを調整するための統計的手法です。どちらも観察データから因果効果を推定するために使われますが、目的や使用する手法には明確な違いがあります。

この記事が気に入ったらサポートをしてみませんか?