【2日目】365日後に統計解析がこわくなくなる！ゆるマラソン『欠損値の処理"Missing Indicator"』

米国で奮闘する医者の日常

2025年2月1日 07:24

毎日1つ、実際の論文で使われているデザイン・統計解析の手法を 分かりやすく 紹介していきます。

統計解析をもっと身近に！1日5分のゆるマラソン🏃‍♂️💨

「論文の統計手法がよく分からない…」「統計解析って難しそう…」

そんなあなたにぴったりの 「1日5分の統計マラソン」！

今日のテーマは COPDの吸入薬とその統計解析 です！

１．COPDの吸入薬ってどれを使えばいいの？

COPD（慢性閉塞性肺疾患）の治療では、 3剤を1つのデバイスにまとめた吸入薬 が広く使われています。

気管支拡張薬 2種（抗コリン薬 + β刺激薬）
ステロイド

日本のガイドラインでは、
「増悪を繰り返す患者に対し、気管支拡張薬2種に吸入ステロイドを追加することを弱く推奨」
となっています。

しかし、デバイスの種類が多すぎて、どれを使えばいいのか 迷いますよね？

例えば、

噴霧式（pMDI）かドライパウダー（DPI）か？
1日の吸入回数は？
各薬剤の種類や強度の違いは？

あとは、噴霧式は温室効果ガスの発生源になっていると言われていたり。

呼吸器内科医でさえ混乱することもあるほど 選択肢が多い ですが、実は head-to-headのRCT（直接比較試験）がほとんどない んです。

そのため、どのデバイスが最適か、 患者さんごとに最適なデバイスを試行錯誤・相談しながら処方する のが現状です。

そこでRCT以外のデータを利用したエビデンスが重要なります。

２．そこで今回の論文！

今回紹介するのは 「COPD患者における3剤配合吸入薬の比較研究」 です。

📄 論文のタイトル

「Comparative effectiveness and safety of single inhaler triple therapies for chronic obstructive pulmonary disease: new user cohort study 」（BMJ, 2024）

🔍 研究の目的

COPDの患者さんに対し、

１．Budesonide-Glycopyrrolate-Formoterol（ブデソニド系ドライパウダー, ビレーズトリ®）

２．Fluticasone-Umeclidinium-Vilanterol（フルチカゾン系噴霧式, テリルジー®）

この2つの 三剤併用吸入薬 を比較し、

COPD増悪の発生率（有効性）
肺炎による入院（安全性）

を調査しました。

👥 研究デザイン

対象者：2021年1月～2023年9月に新規にこれらの吸入薬を使い始めた 20,388組の患者（傾向スコアマッチング後）
データソース：米国の医療保険請求データ
解析手法： 1:1の傾向スコアマッチング + Cox比例ハザードモデル

📊 主要な結果

ブデソニド系吸入薬はフルチカゾン系より、

COPD増悪のリスク9% 高い（HR 1.09, 95% CI 1.04-1.14）
重症COPD増悪のリスク29% 高い（HR 1.29, 95% CI 1.12-1.48）
肺炎による入院リスク差なし（HR 1.00, 95% CI 0.91-1.10）

📝 結論

ブデソニド系吸入薬では、COPD増悪のリスクがフルチカゾン系よりも高い
肺炎のリスクには有意な差なし
環境負荷を考慮すると、フルチカゾン系（DPI）の選択が推奨される可能性

この結果を統計的に どのように導いたのか？
統計解析の詳しい解説 をしていきます！

３．Statistical Analysis

a. 欠損値の処理に欠損指標 (Missing Indicator) を使用？

In the case of missing data for covariates in our model, we used a missing indicator.

BMJ 2025

これは、欠損があるデータポイントに対して 「欠損している」こと自体を示すダミー変数を作成 し、回帰モデルに含めます。

📌なぜMultiple imputation（多重代入法）ではなくMissing indicatorか？

統計モデルに投入する共変量に欠損値があると、その患者は解析から除外されてしまい、サンプルサイズが減少し、統計的なパワーが低下する 可能性があります。欠損データを適切に処理するために、多くの研究では Multiple Imputation（多重代入法） が使われます。

しかし、今回の研究では Missing Indicator Method を採用しました。考えられる理由は以下の通りです。

Multiple imputationでは、欠損値ごとに異なる複数の補完データセットを作成するため、それぞれで異なる傾向スコアマッチングを行うことになり解析が困難
保険請求データを用いた研究であり、欠損がランダムではない可能性が高い（例：より健康な人は検査を受けていない）
Multiple imputationは計算負荷が高く、解析時間が長くなる
Multiple imputationを行った後では、感度分析の評価が難しくなる（Multiple Imputationで補完した値が、解析にどの程度影響を与えたかも考慮する必要がある）

b. 負の二項回帰（Negative Binomial Regression）とは？

この研究では、年間のCOPD増悪回数や肺炎入院回数の解析に「負の二項回帰」を使用しています。
この負の二項回帰とはなんでしょうか？

負の二項回帰は、ポアソン回帰と似た手法で、カウントデータ（回数データ）を解析するために使われます。例えば、「1年間にCOPD増悪が何回起きたか？」を分析するのに適しており、COPD増悪のリスクを、イベント発生率の比（Incidence rate ratio）として推定できます。

次回、この負の二項回帰をもう少し詳しく解析していきます。

2025/1/31

いいなと思ったら応援しよう！

もしよろしければ、応援いただけると嬉しいです！いただいたサポートを励みに、さらに良い記事をお届けできるよう頑張ります✨