![見出し画像](https://assets.st-note.com/production/uploads/images/162151987/rectangle_large_type_2_e84826c4dac6d007cf0ad7e9691243eb.jpeg?width=1200)
冠動脈疾患(CHD)ポリジェニックリスクスコア(PRS):遺伝的感受性に関する個人レベルの推定値は大きく変動し、集団レベルと大きく異なる:リスクスコア再考察必要
CHDに関わらず、さまざまな領域で、集団を対象に調査したリスク要素を個人に適用することでリスク推定がなされているが、
差し当たり個人レベルではIntraclass Correlation Coefficient (ICC) やLight κなどの個別でその一貫性に関して評価が必要と思う
Abramowitz, Sarah A., Kristin Boulier, Karl Keat, Katie M. Cardone, Manu Shivakumar, John DePaolo, Renae Judy, ほか. 「Evaluating Performance and Agreement of Coronary Heart Disease Polygenic Risk Scores」. JAMA, 2024年11月16日. https://doi.org/10.1001/jama.2024.23784.
重要ポイント
質問
冠動脈疾患(CHD)の遺伝的リスクを個人ごとに予測する際、集団レベルで同等の性能を示すポリジェニックリスクスコア(PRS)の間で一貫性はあるのか?
発見
集団レベルで同等の性能を持つ46のPRSを用いた場合、「All of Us Research Program」における個別リスク推定は不一致を示した。参加者の20%が、46のほぼ同等なPRSの中で少なくとも1回、リスクの上位5%と下位5%の両方に分類された。
意義
集団レベルで同等の性能を持つCHD PRSは、個人のリスク推定において一貫性がない可能性がある。CHD PRSの個別化された応用および臨床解釈には、個人レベルでのリスク予測の不確実性を考慮すべきである。
要旨
重要性
冠動脈疾患(CHD)におけるポリジェニックリスクスコア(PRS)は、臨床および商業の分野でますます普及している。既存のスコアが個人レベルで同様の疾患感受性評価を提供するかどうかは、未だ十分に特定されていない。
目的
集団レベルで同等の性能を持つCHD PRSの個人レベルでの一致度を評価すること。
デザイン、設定、参加者
電子健康記録およびジェノタイピングデータを有する「All of Us Research Program(AOU)」、「Penn Medicine BioBank(PMBB)」、および「University of California, Los Angeles(UCLA) ATLAS Precision Health Biobank」に登録された多様な背景の参加者を対象とした横断研究。
曝露
公開されたPRSおよび検査サンプルとは独立して開発された新規PRSによるCHDのポリジェニックリスク。
主要なアウトカムと測定
集団レベルで予測性能が同等のPRSは、CHDの有病率モデルの較正および識別力を比較することで特定した。個人レベルでの一致度は、クラス内相関係数(ICC)およびLight κを用いて評価した。
結果
171,095人のAOU参加者に対し、48のPRSが計算された。参加者の平均年齢(標準偏差)は56.4歳(16.8歳)で、104,947人(61.3%)が女性であった。参加者の35,590人(20.8%)はアフリカ系、29,801人(17.4%)は混血系アメリカ人、100,493人(58.7%)はヨーロッパ系の遺伝的背景を持つとされた。
CHDを有する参加者は17,589人(10.3%)、有しない参加者は153,506人(89.7%)であった。有病率モデルにおいて46のスコアは、Brierスコアおよび受信者動作特性曲線(±0.02の実用的等価性範囲)の観点で実質的に同等の性能を示した。
しかし、参加者の20%が少なくとも1つのスコアでリスクの上位5%と下位5%の両方に分類された。
個別予測の連続的一致度は低く(ICC, 0.373 [95% CI, 0.372-0.375])、リスク分類の一貫性を評価するLight κは0.56を超えなかった。PMBB(41,193人)およびATLAS(53,092人)参加者での解析では、異なる同等スコアのセットが得られ、個人レベルでの一致度も欠如していた。
結論と意義
集団レベルで同等の性能を示したCHD PRSは、個人レベルでのリスク推定が大きく変動することが明らかとなった。CHD PRSが不一致のリスク推定を生み出す可能性を認識し、効果的な臨床実施には、不確実性を定量化するための洗練された統計手法およびその不確実性を患者や臨床医に伝える新たな戦略が必要である。
序文要約
ポリジェニックリスクスコア(PRS)は、冠動脈疾患(CHD)の予防と治療を改善するツールとして提案されている。PRSはリスクバリアントの効果を集約し、個人の疾患リスクの遺伝的要素を要約するものである。これにより、CHDリスクが高い個人を早期に特定し、精密な心血管医療の一環として重点的な一次予防を実施することが可能とされる。応用例として、PRSを臨床変数と組み合わせた総合的リスクモデルへの利用、境界リスクの個人に対するリスク増強因子としての活用、または単独のリスク評価試験として用いることが挙げられる。
CHD PRSは「ポリジェニックスコア(PGS)カタログ」に多数登録されており、報告の標準化と改善を目指している。また、商業的に販売されている独自のスコアもあり、それらは遺伝的関連データ、手法、重み付けが多様に報告されている。
専門家のコンセンサスによる推奨事項は、集団レベルでのリスク推定の評価方法やスコア同士の比較方法の枠組みを提供している。これらの集団レベルの分析結果に基づき、複数のCHD PRSが臨床実施に向けた動きを見せている。しかし、個人の遺伝的リスクを算出する基準的な標準手法が存在しないため、PRSによる推定が真の値(正確性)にどれだけ近いかを評価することはできない。その代わり、非基準的な参照スコアとの結果の一致(精度)を評価することが行われている。
本研究では、利用可能なCHD PRSの集団レベルでの性能を評価し、その中で同等の性能を示したスコアセットにおける個人レベルでのリスク推定の一致度を比較することを目的とした。
方法:
研究対象集団
本研究は、全米規模の成人ボランティアからなる「All of Us(AOU)研究プログラム」のデータを使用して実施された。
AOUは電子健康記録と遺伝データを匿名化して解析することに同意した参加者で構成されている。
CHD(冠動脈疾患)の表現型は、特定のICD-9およびICD-10コードに基づきバイナリ変数として定義された。
参加者は、1000 GenomesやHGDP(ヒトゲノム多様性プロジェクト)の参照集団との遺伝的類似性に基づき、6つの集団グループに分類された。
「Penn Medicine BioBank(PMBB)」および「UCLA ATLAS Biobank」も同様の方法で解析に使用された。
PRSの選定と作成
CHDのポリジェニックリスクスコア(PRS)は「PGSカタログ」から選定された。
加えて、新規に作成された2つのPRSが解析に含まれたが、これらの作成にはAOU、PMBB、ATLASのデータは使用されていない。
PRSの計算方法
集団間の対立遺伝子頻度や連鎖不平衡の異質性がPRS分布に影響を与えるため、PCA(主成分分析)に基づく方法でスコアを正規化した。
これにより、すべてのサンプルで標準化された解釈が可能となった。
集団レベルでの評価
一般化線形回帰モデルを使用し、各PRSとCHDの関連性を年齢や性別を共変量として評価した。
モデル性能は、Brierスコア(2値分類の平均二乗誤差)およびAUROC(受信者動作特性曲線下面積)で評価された。
Bayesian分析により、統計的および実用的に等価なスコアを特定した。
個人レベルでの評価
実用的等価性基準(±0.02)を満たすスコアのリスクパーセンタイルを平均化し、個人の平均リスクパーセンタイルを計算した。
スコア間の一致度を評価するため、クラス内相関係数(ICC)とLight κを使用した。
高リスク群の判定では、上位5%、10%、20%のカットオフで異なるスコア間の一致度を評価した。
統計解析
観察研究の報告指針(STROBE)に従い、R(バージョン4.3.x)を用いて解析を実施した。
集団レベルの解析ではBrierスコアとAUROC、個人レベルの解析ではLight κとICCを使用した。
κとICCの解釈基準に基づき、中間的な値の意味を評価した。
結果
臨床的特徴
AOUの研究対象者はCHDを有する17,589人(10.3%)と有しない153,506人(89.7%)で構成されている。
CHDを有しない参加者の63.4%が女性であり、CHDを有する参加者では43.7%が女性である。
参加者の20.8%がアフリカ系、17.4%が混血アメリカ系、58.7%がヨーロッパ系、残りが中央/南アジア系、東アジア系、中東系に分類された。
CHDを有する参加者は平均年齢が高く(69.3歳 vs. 54.9歳)、PMBB(22.4%)やATLAS(23.5%)ではCHDの有病率がAOUよりも高かった。
集団レベルでのPRS性能
48のCHD PRSが解析され、2つはCHDとの負の関連が確認され除外された。
残る46スコアはCHDリスクと有意に関連し、オッズ比は1.10~1.46の範囲であった。
PGS005091は最良の校正(Brierスコア0.0825)、PGS003725は最良の識別(AUROC 0.777)を示した。
実用的等価性(±0.02)の基準では、46スコアは集団レベルでほぼ等価とされた。
厳密な基準(±0.01および±0.005)では、それぞれ19スコアと5スコアが等価とされた。
遺伝的類似性による層別解析では、等価性基準を満たすスコアセットが異なった。
個人レベルでのPRSリスク評価の一致性
ROPE ±0.02基準を満たすスコアで、個人レベルのリスク推定の一貫性を評価した。
リスクパーセンタイルの標準偏差の中央値は22.94、変動係数の中央値は0.504であった。
クラス内相関係数(ICC)は0.373であり、一貫性は「低い」と解釈される。
厳密な基準(±0.01および±0.005)では、ICCはそれぞれ0.555および0.734に改善された。
Light κ(リスク分類の一致度)はいずれの閾値でも0.56を超えなかった。
実用的等価スコア間のリスク推定の相関は0.028~0.98と幅広く、同一研究由来のスコア間では相関が高かった(中央値0.56 vs. 0.36)。
個人リスク推定の変動
46スコアのうち、52%の個人が1つのスコアでリスク上位5%と分類され、同時に他のスコアでは非該当とされた。
全体の20%(上位5%と下位5%の両方に分類される)がリスクの矛盾を経験した。
上位20%のリスク分類では、80%が1つのスコアで上位20%、別のスコアで下位20%とされた。
結論
CHD PRSは集団レベルでは実用的に等価と評価されるが、個人レベルのリスク推定では大きな変動がみられる。
一貫性の欠如は、臨床応用やリスクコミュニケーションにおいて慎重な検討を要する。
Discussion要約
研究の概要と主な結論
265,380人のデータを用いた本研究は、CHDの遺伝的感受性に関する個人レベルの推定値が、集団レベルでの同等な性能にもかかわらず大きく異なることを示した。
PRSの集団および個人レベルでの性能評価の課題が明らかになり、PRSを遺伝リスクの互換可能な評価として用いる妥当性に疑問を投げかける結果となった。
本研究の結果は、CHD用PRSの臨床実装に対して重要な影響を与える。
集団レベルでの課題
単一のPRSを広く臨床実装に適用する選択の難しさが示された。
大規模かつ多様なトレーニングデータ、スコア構築の進歩、心血管疾患関連特性の組み込みが性能向上に寄与する可能性が示唆されたが、その改善はごくわずかであり、ほとんどの場合、ROPE ±0.02未満であった。
全ての解析で最良の性能を示すスコアは存在せず、環境(人口の年齢、性別、社会経済的構成、遺伝的背景)により性能が変化することが確認された。
個人レベルでの課題
集団レベルで同等の性能を示すCHD PRSは、個人レベルでは互換性がない。
実用的および統計的に等価なスコア間でも、個人レベルでの推定値に大きな変動が観察された。
トレーニングデータ、集団グループ、スコア開発時期で層別化しても、強い一致性は得られなかった。
この不一致は、トレーニングデータセットや方法論だけでは説明できず、PRSには本質的な不確実性が伴うものであると結論付けられる。
臨床実装への影響
ポリジェニックリスクの異なる推定値を解釈するための患者および臨床医向けの指針が現在存在しない。
PRSの精度や不確実性についての議論が不足しており、これが臨床実装の課題を複雑にしている。
評価が外部で行えない独自のスコアの増加により、混乱や潜在的な害を引き起こす可能性がある。
今後の課題
CHD PRSの評価基準、ガイドライン策定、および研究デザインの改善が必要である。
個人レベルのリスク推定における不一致の影響を考慮しつつ、集団レベルの心血管健康を向上させるための実用的な取り組みを行うべきである。
統計手法について大学初学レベル向けにわかりやすく解説します。
個人レベルのPRS評価について
1. 遺伝リスク推定の分布を理解するための統計的解析
PRS(ポリジェニックリスクスコア)は個人の遺伝的リスクを数値で表します。
同じような性能を持つ複数のスコアを用いて、各個人のリスク推定値を計算し、その分布を調べました。
平均リスクパーセンタイルを計算しました:
各個人のリスク推定値をパーセンタイル(全体の中で何番目に位置するか)で表し、全スコアの平均を計算しました。
このパーセンタイルの平均値を使って「その人が全体でどれくらい高リスクか」を見ました。
**標準偏差(SD)と変動係数(CV)**を計算しました:
SDは、同じ人について異なるスコアがどれくらいばらつくかを表します。
CVは、SDを平均値で割ったもので、ばらつきの割合を示します。
2. データの可視化と解析
それぞれの個人について、平均リスクパーセンタイル、標準偏差、変動係数を計算し、その分布をプロットしました。
データ全体の中央値(真ん中の値)を計算し、リスク推定が集団内でどう分布しているかを把握しました。
計算の信頼性を高めるために、「ブートストラップ」という方法を使って95%信頼区間(CI)を求めました。これにより、結果がどれくらい安定しているかを示しました。
3. PRSの正確性ではなく「一致性」を評価
PRSの正確性(本当にリスクを正確に予測しているか)は、基準となる「正解」がないため評価できませんでした。
代わりに、複数のスコア間で結果がどれくらい一致しているか(精度)を評価しました。
**クラス内相関係数(ICC)**を使用:
ICCは、複数の評価者が同じものを評価した場合の一貫性を測る指標です。数値が高いほど、スコア間の一致度が高いことを意味します。
4. 高リスク群の定義と評価
臨床応用では、上位5%、10%、20%のパーセンタイルを使って高リスク群を定義することがよくあります。
各スコアで同じ個人が高リスク群に分類される割合を調べました。
例えば、あるスコアでは「上位5%の高リスク」とされても、別のスコアではそう分類されない場合があります。
Light κという指標を使って、スコア間で高リスクと分類された一致度を評価しました。
Light κは、分類がどれくらい一致しているかを数値化します。1に近いほど一致度が高く、0に近いほどランダムに分類されたことを意味します。
5. スコア間のリスク推定の相関
各スコアペア間でのリスク推定値の相関(関連性)を調べるため、**ピアソン相関係数(r)**を計算しました。
rの値は-1から1の範囲をとり、1に近いほどスコア間のリスク推定が強く関連していることを示します。
まとめ
この解析では、複数のスコアが個人ごとのリスク推定にどれだけ一致しているかを評価しました。しかし、スコアごとに結果が大きく異なることも多く、どのスコアを使うべきかや、それをどう解釈するべきかについて慎重に考える必要があることがわかりました。特に、個人レベルの不一致が臨床での応用に大きな課題となっています。
Intraclass Correlation Coefficient (ICC) は、同じ対象に対する測定値間の一貫性や信頼性を評価するための統計指標であり、以下の一般的な形式で表されます:
ICC=σbetween2σbetween2+σwithin2\text{ICC} = \frac{\sigma^2_\text{between}}{\sigma^2_\text{between} + \sigma^2_\text{within}}ICC=σbetween2+σwithin2σbetween2
ここで:
σbetween2\sigma^2_\text{between}σbetween2: 対象間の分散(測定対象全体での値のばらつき)
σwithin2\sigma^2_\text{within}σwithin2: 対象内の分散(同じ対象内での測定値のばらつき)
ICCの分解
ICCは、測定値の総分散に対する「対象間の分散」の割合を表します。
ICC=対象間の分散対象間の分散+対象内の分散\text{ICC} = \frac{\text{対象間の分散}}{\text{対象間の分散} + \text{対象内の分散}}ICC=対象間の分散+対象内の分散対象間の分散
または、総分散を σtotal2\sigma^2_\text{total}σtotal2 とすると:
ICC=σbetween2σtotal2\text{ICC} = \frac{\sigma^2_\text{between}}{\sigma^2_\text{total}}ICC=σtotal2σbetween2
ここで、σtotal2=σbetween2+σwithin2\sigma^2_\text{total} = \sigma^2_\text{between} + \sigma^2_\text{within}σtotal2=σbetween2+σwithin2。
ANOVAを用いたICCの計算
ANOVA(分散分析)の結果を用いて計算する場合、ICCは以下のように定義されます:
ICC=MSbetween−MSwithinMSbetween+(k−1)⋅MSwithin\text{ICC} = \frac{\text{MS}_\text{between} - \text{MS}_\text{within}}{\text{MS}_\text{between} + (k - 1) \cdot \text{MS}_\text{within}}ICC=MSbetween+(k−1)⋅MSwithinMSbetween−MSwithin
ここで:
MSbetween\text{MS}_\text{between}MSbetween: 対象間の平方平均(Mean Square Between Subjects)
MSwithin\text{MS}_\text{within}MSwithin: 対象内の平方平均(Mean Square Within Subjects)
kkk: 各対象に対する測定回数(例:評価者の数や繰り返し回数)
ICCのバリエーション
ICCには研究デザインや測定目的に応じて複数の種類がある。代表的なものは以下の通り:
単純一致(ICC(1,1)):
各測定値を独立と仮定。
測定者間の分散のみを考慮。
平均一致(ICC(1,k)):
各測定値の平均を基に一致度を評価。
測定者の分散を低減。
双方向モデル(ICC(2,1) or ICC(3,1)):
測定値がすべての対象で共通の条件下で得られていると仮定。
測定者の影響をモデル化。
ICCの値の解釈
ICC=1\text{ICC} = 1ICC=1: 完全一致。
ICC=0\text{ICC} = 0ICC=0: 測定値間の一致がランダム。
ICC<0\text{ICC} < 0ICC<0: 測定間で不一致が多い(分散が誤差の影響を受けすぎている場合)。
一般的な解釈のガイドライン:
0.00≤ICC<0.500.00 \leq \text{ICC} < 0.500.00≤ICC<0.50: 一致が低い。
0.50≤ICC<0.750.50 \leq \text{ICC} < 0.750.50≤ICC<0.75: 一致が中程度。
0.75≤ICC<1.000.75 \leq \text{ICC} < 1.000.75≤ICC<1.00: 一致が高い。
まとめ
ICCは、対象間の分散が測定全体の分散に占める割合として、一貫性を数値で示す。計算には分散成分を分解する手法(ANOVAなど)が用いられ、測定の種類や条件に応じて異なるモデルが採用される。
Light κ (カッパ) の数式は、観察された一致度と期待される一致度を比較して測定します。以下にその数式を示します:
κ=Po−Pe1−Pe\kappa = \frac{P_o - P_e}{1 - P_e}κ=1−PePo−Pe
PoP_oPo: 観察された一致度(Observed Agreement)
PeP_ePe: 期待される一致度(Expected Agreement)
項目の詳細説明
観察された一致度 (PoP_oPo): 実際に観測された分類の中で、どれだけ一致しているかを割合で表します。
Po=一致している分類の数全体の分類の数P_o = \frac{\text{一致している分類の数}}{\text{全体の分類の数}}Po=全体の分類の数一致している分類の数
期待される一致度 (PeP_ePe): ランダムに分類された場合に期待される一致度を割合で計算します。以下の式で求めます:
Pe=∑i=1k(piA⋅piB)P_e = \sum_{i=1}^k (p_i^A \cdot p_i^B)Pe=i=1∑k(piA⋅piB)
ここで、
kkk: 分類のカテゴリ数
piAp_i^ApiA: カテゴリ iii に分類される割合(評価者Aによる)
piBp_i^BpiB: カテゴリ iii に分類される割合(評価者Bによる)
計算のステップ
観察された一致度 PoP_oPo を計算。
期待される一致度 PeP_ePe をカテゴリごとの確率から計算。
上記の値を κ=Po−Pe1−Pe\kappa = \frac{P_o - P_e}{1 - P_e}κ=1−PePo−Pe に代入。
κの範囲
κ=1\kappa = 1κ=1: 完全一致。
κ=0\kappa = 0κ=0: ランダムな一致。
κ<0\kappa < 0κ<0: 一致がランダム以下(不一致が多い)。
注意: Light κはカテゴリデータの一致度を評価するための指標であり、カテゴリが複数ある場合(2カテゴリ以上)に適しています。