リスク因子解析の本当の意味と実践方法

米国で奮闘する医者の日常

2025年2月14日 15:02

臨床研究の目的は大きく3つに分類されます。

「リスク因子解析」
「独立した関連性の特定」
「予測モデルの構築」

この３つの違いを理解し、リスク因子解析をどのように適切に実践するか を学んでいきましょう！

1. 今回の論文：進行性線維化肺疾患（PPF）における急性増悪のリスク因子解析

📄 論文タイトル
"Acute exacerbations in patients with progressive pulmonary fibrosis"（ERJ Open Res, 2024）

🔍 研究の目的

進行性線維化肺疾患（PPF）における急性増悪（AE）のリスク因子と予後への影響を評価すること。

👥 方法

PPFに対するオフェブとプラセボを比較したINBUILD試験のPosthoc解析
INBUILD試験に登録されたPPF患者663名（ニンテダニブ群 vs. プラセボ群）。
急性増悪の発生リスクを Cox比例ハザードモデルで解析。

📊 主要な結果

DLCOが低いほど急性増悪のリスクが上昇（HR 1.56, 95% CI 1.21–2.02, p<0.001）。
急性増悪後30日以内、90日以内の死亡リスクはそれぞれ19.0% (95% CI 8.9–29.2) 、32.0% (95% CI 19.7–44.2)であった。

📝 結論

PPFにおける急性増悪はIPFと類似したリスク因子を持ち、高い死亡リスクと関連する。
DLCO低下が急性増悪のリスク因子であることが示唆された。

2. Statistical Analysis

a. リスク因子解析とは？

リスク因子解析は、アウトカム（結果）と統計的に関連する因子を特定するために、多くの変数を検討する手法です。具体的には、ある疾患の発症や進行に関与する可能性のある要因を探索し、潜在的な関連を特定することを目的とします。

統計的に関連する因子を特定するために、回帰モデルを使用します。モデルに投入する変数は、「データ駆動型（例：Stepwise法、10%ルール、AIC/BIC）」または「知識駆動型（過去の報告や専門家の知識）」によって決定されます。つまり、本来独立した関連性を示すために必要な交絡因子とは関係なく選択されます。

この解析の目的は因果関係を検証することではなく、未知のリスク要因を特定することにあります。そのため、得られた知見は直接的に臨床指針として用いるものではなく、あくまで将来の研究を推進するための基盤となります。

一方で、リスク因子解析と以下の研究は明確に異なる目的を持ちます：

「独立した関連性の特定」
→ 交絡（confounding）、効果修飾（effect modification）、相互作用（interaction）を考慮し、因果関係を検証（test a causal hypothesis）する研究
「予測モデルの構築」
→ ハイリスク患者を特定し、個々のリスクを予測するための研究

リスク因子解析は、将来的に「独立した関連性の特定」や「予測モデルの構築」、さらにはランダム化比較試験（RCT）による因果関係の解明へとつながる、最初の重要な研究プロセスと言えます。

b. なぜリスク因子解析をするのか

リスク因子解析は、ある因子とアウトカムの独立した関連性を証明することが目的ではありません。しかし、それでも疾患の理解を深め、将来の研究や臨床応用につなげるために重要な研究です。その理由を、以下の4つの観点から説明します。

1．観察結果の報告
未知の疾患については、データdrivenなその疾患と要因の関連を報告することは重要です。例えば、新型ウイルス感染症において、喫煙者が非喫煙者よりも重症化しやすいというデータが得られたとします。このような観察結果を論文として報告することで、医療従事者や研究者に新たな知見を提供できます。

2．リスク層別化
特定の集団がより高いリスクをもつことを特定することで、早期診断や予防策の強化を検討することができます。

3．因果関係のヒントを得る
リスク因子解析では因果関係を証明することはできませんが、「この要因が関与している可能性がある」というヒントを得ることができます。これが、次の研究につながります。

4．将来の研究の方向性を示す
リスク因子解析の結果は、次の段階の研究（独立した関連性の特定、予測モデル構築、RCTなど）に進むための重要な出発点となります。

c. リスク因子解析の問題点

1．リスク因子は独立した関連因子にはならない
交絡因子を考慮しないと、バイアスが発生する。つまり統計的有意性だけで変数を選択すると、重要な交絡因子が除外される可能性がある。逆に、偶然有意だった不要な変数を含めるリスクもある。

2．モデルにより結果が異なる
どのリスク因子をモデルに含めるかによって、解析結果が大きく変わる

3．多重比較の問題
複数の検定を試行すると、偶然の有意差が発生するリスクがある。
例：5%の有意水準であっても、20個のリスク因子を検討すると、少なくとも1つは偶然有意になる可能性が高い。

それでもリスク因子解析は一見無関係に見える事実を集め、後の研究で因果関係が説明されるまでの間、貴重な情報源となります。

参考文献
PMID: 15308951

d. 本論文でのリスク因子解析のステップ

本論文では、Cox比例ハザードモデルを用いて、PPFの急性増悪リスク因子を特定しています。その際、前向きステップワイズ法とAIC（赤池情報量基準）を活用して、最適なリスク因子の組み合わせを選択しました。

1．多変量解析
過去の文献に基づき、AEのリスク因子として考えられる変数をすべてCox比例ハザードモデルに投入。

2．前向きステップワイズ法にてリスク因子の選択

すべての候補変数をCox比例ハザードモデルに投入し、最もP値が小さい変数から順に選択。
P値が0.2より小さい変数がなくなるまで、変数を一つずつモデルから除外。
最終的に、独立したリスク因子のみを残す。

3．AICを用いたモデル選択

ステップワイズ法で選択したリスク因子を一つずつCox比例ハザードモデルに加え、AICの変化を確認。
AICが最も小さいモデルを最終モデルとする。

4．最終モデルで推定値を算出
同定したリスク因子を全て共変量とてCox比例ハザードモデルに投入し、推定ハザード比を計算する。

AICとは？
AIC（Akaike Information Criterion, 赤池情報量基準）は、統計モデルの適合度と複雑さのバランスを評価 する指標です。

AIC=−2×log(L)+2k
L : モデルの対数尤度（データにどれだけ適合するか）
k : モデルの自由度（選択されたパラメータ数）

AICが小さいほど、モデルは「データに良く適合し、かつ過剰に複雑でない」とみなされます。この値を用いて、異なるモデル間でどのモデルが最もgoodness of fitかを判断する一つの指標です。

3. まとめ

リスク因子解析の目的は、因果関係を検証することではなく、統計的な関連を明らかにすること。あくまで「ブラックボックス」として捉えるべきである。

得られた知見は、直接的に臨床指針として用いるものではなく、将来の介入研究や追加の検証研究に役立てるための基礎的な情報となる。

次回もお楽しみに！

2025/2/13

いいなと思ったら応援しよう！

もしよろしければ、応援いただけると嬉しいです！いただいたサポートを励みに、さらに良い記事をお届けできるよう頑張ります✨