![見出し画像](https://assets.st-note.com/production/uploads/images/158790560/rectangle_large_type_2_34a07306a1f7483476c8f585b4c55091.jpeg?width=1200)
特発性肺線維症:SMR解析、MR解析
Zhang, Kun, Puyu Shi, Anqi Li, Jiejun ZhouとMingwei Chen. 「Plasma genome-wide mendelian randomization identifies potentially causal genes in idiopathic pulmonary fibrosis」. Respiratory Research 25, no. 1 (2024年10月18日): 379. https://doi.org/10.1186/s12931-024-03008-5.
要約
背景
特発性肺線維症(IPF)は非常に予後不良な複雑な肺疾患である。IPFの治療薬は現在でも十分とは言えない。そのため、IPFの予防と治療のための新しい薬剤標的の探索が必要である。
方法
遺伝子、DNAメチル化、血漿中のタンパク質に関する数量的形質座(QTL)およびIPFに関するサマリースタティスティクスを含めた。遺伝子の500kb以内に位置し、血漿中濃度に強く関連する遺伝的変異を操作変数として使用した。血漿中濃度とIPFとの因果関係は、主にサマリーデータに基づくメンデルランダム化(SMR)解析によって推定した。SMRの結果を検証するために、他の5つのMR方法と感度分析も用いた。QTLとIPFリスク座のコロカライゼーションのベイズ検定も行い、MRの結果をさらに強化した。
結果
SMR解析、MR解析の検証、感度分析、コロカライゼーション解析により、IPFに因果的に関連する3つの遺伝子と5つのDNAメチル化サイトを特定した。BTRCとLINC01252はIPFリスクと負の関連があった(OR: 0.30, 95% CI: 0.17–0.54, FDRSMR = 0.029; OR: 0.85, 95% CI: 0.78–0.92, FDRSMR = 0.043)。一方、RIPK4はIPFリスクと正の関連があった(OR: 2.60, 95% CI: 1.64–4.12, FDRSMR = 0.031)。cg00045227(OR8U8, OR: 1.16, 95% CI: 1.08–1.24, FDRSMR = 0.010)、cg00577578(GBAP1, OR: 1.23, 95% CI: 1.12–1.36, FDRSMR = 0.014)、cg14222479(ARPM1, OR: 3.17, 95% CI: 1.98–5.08, FDRSMR = 0.001)、cg19263494(PMF1, OR: 1.20, 95% CI: 1.10–1.30, FDRSMR = 0.012)はIPFリスクと正の関連があり、cg07163735(MAPT, OR: 0.22, 95% CI: 0.11–0.45, FDRSMR = 0.013)はIPFリスクと負の相関があった。
結論
本研究は、BTRC、RIPK4、LINC01252遺伝子の血漿中濃度およびcg00045227(OR8U8)、cg00577578(GBAP1)、cg07163735(MAPT)、cg14222479(ARPM1)、cg19263494(PMF1)のメチル化レベルがIPFリスクに因果的な影響を与えることを示した。
特発性肺線維症(IPF)は、呼吸困難や進行性の肺機能低下を特徴とする慢性で稀かつ不可逆的な間質性肺疾患である。
IPFの予後は悪く、治療が行われない場合、診断後の平均余命は3〜5年である。
北米およびヨーロッパにおけるIPFの発症率は年間10万人あたり3〜9例であり、時間の経過とともに全体的な発症率は増加する傾向にある。
高齢化に伴い、IPFは世界的な公衆衛生負担に大きな影響を与えると予測されている。
IPFの線維化メカニズムは未解明であるが、加齢による肺上皮の機能不全に対する反復的な微小損傷が原因とされている。
IPFの管理の鍵は病気の進行を遅らせることである。ピルフェニドンとニンテダニブの2つの薬剤が治療に推奨されている。
ピルフェニドンはTGF-β誘導性の線維化反応を抑制する効果があるが、他のメカニズムは不明である。ニンテダニブはFGF、PDGF、VEGF受容体の強力な阻害剤であり、線維芽細胞や筋線維芽細胞のシグナル伝達を阻害する。
他の薬剤(リコンビナントヒトペントラキシン2、パムレブルマブ、吸入トレプロスチニル、N-アセチルシステイン)も試みられているが、満足のいく結果は得られていない。
環境要因および遺伝的素因は、IPFの病因に関する主要な研究対象であり、遺伝的バイオマーカーはIPFのリスクと進行を予測する手段となる。
MR(メンデルランダム化)解析は、因果的関連を研究し、潜在的な薬剤標的を特定するために広く利用されている。
本研究では、血漿中の遺伝子発現QTL(eQTL)、DNAメチル化QTL(mQTL)、およびタンパク質発現QTL(pQTL)データに基づき、SMRおよびHEIDI解析を行った。
SMRおよびMR解析(TwoSampleMR Rパッケージ)による主要な結果は、感度分析や共局在化分析によってさらに検証された。
最後に、肺組織のeQTLデータを用いて、IPFに関連する一般的な遺伝的変異を検証した。
本研究は「Strengthening the Reporting of Observational Studies in Epidemiology using MR」のガイドラインに基づいて実施された。
研究デザインとデータ源
研究は2つの段階に分けて行われた。
第1段階: 血漿遺伝子発現、DNAメチル化、タンパク質発現の因果関係を特定するためにSMR解析を実施。
第2段階: MR(TwoSampleMR Rパッケージ)解析を用いて検証と感度分析を行い、さらに共局在化解析も実施した。
使用されたデータ源:
cis-eQTL: QTLGenコンソーシアムから取得した10,317のSNPに関するデータ(31,684人の個体から)。
mQTL: 2つのコホート(1,980人)からの末梢血DNAメチル化データのメタ解析。
pQTL: 4,435の血漿タンパク質に関するデータ(7,213人の欧米人から)。
IPFのサマリーデータ: FinnGenデータベースの最新リリースから取得(2,018例の症例、373,064例の対照)。
統計解析
SMR解析:
因果推定において、遺伝子変異を操作変数として使用。
2段階最小二乗法(2SLS)を用いて解析。
P < 5e-8をSMRテストのQTL選択基準とし、HEIDIテストでリンクの影響を評価した。
OR(オッズ比)は、自然対数の底を基に計算した。
ベンジャミニ・ホッホベルグ法で多重検定における偽発見率(FDR)を調整。
P < 0.01のHEIDIテスト結果はリンクによる影響がある可能性を示し、解析から除外。
TwoSampleMR検証:
MR Egger、Weighted Median、Inverse Variance Weighted (IVW)、Simple Mode、Weighted Modeの5つのMR法を用いてSMR結果を検証。
弱い操作変数の影響を排除するため、F統計値が10以下の操作変数を除外。
異質性、多面性、感度分析(Leave-one-out法)も実施し、因果関係を強化。
MRの結果はP < 0.05で統計的に有意と見なした。
ベイズ共局在化解析:
SMR解析結果のさらなる検証としてベイズ共局在化解析を実施。
coloc Rパッケージ(バージョン5.1.0)を用いて共局在化解析を行った。
PP.H4 > 0.8は、GWASとQTLの共局在化の証拠と見なされた。
全ゲノムcis-eQTL解析(IPFとの関連)
SMR解析により、6,951,690個のSNPが15,582個の血漿中転写物と強く関連し、これら転写物とIPFの因果関係を評価。
偽陽性を抑えるため、FDR補正(FDR < 0.05)とHEIDIテスト(PHEIDI > 0.01)を実施し、共有因果変異の影響を検討。
BTRC、THBS3、CD151、RIPK4、LINC01252、RP11-259G18.3の6つの血漿遺伝子がIPFと因果的に関連。
BTRC、CD151、LINC01252、RP11-259G18.3の発現増加はIPFリスク低下に関連(ORそれぞれ0.30, 0.85, 0.85, 0.60)。
THBS3、RIPK4の発現増加はIPFリスク増加に関連(ORそれぞれ1.27, 2.60)。
TwoSampleMR Rパッケージの他のMR手法による検証でも、BTRC、RIPK4、LINC01252、RP11-259G18.3との因果関係が確認。
ベイズ共局在化解析ではBTRC、RIPK4、LINC01252の発現とIPFが共通の因果変異を共有(PP.H4 > 0.80)。
全ゲノムcis-mQTL解析(IPFとの関連)
13,020,279個のSNPが65,440個の血漿中DNAメチル化部位と強く関連。
SMRおよびHEIDIテストにより、IPFと因果的に関連する15の遺伝子座を特定。
5つの遺伝子座(cg00045227、cg00577578、cg14222479、cg19263494、cg07163735)がさらに検証され、うち4つはIPFリスク増加、1つ(cg07163735)はIPFリスク低下に関連。
cg00045227(OR8U8)のMR解析では、6つのSNPがIVsとして機能し、異質性テスト、PLEIOTROPYテスト、感度分析(Leave-one-out法)により強い因果関係が確認された。
ベイズ共局在化解析により、5つのメチル化部位がIPFと共通の因果変異を共有(PP.H4 > 0.80)。
全ゲノムcis-pQTL解析(IPFとの関連)
526,719個のSNPが1,521個の血漿中タンパク質と強く関連。
SMR解析により、1,521個の血漿中タンパク質とIPFの因果関係を評価したが、FDR補正済みのSMR解析結果では因果関係の証拠は得られなかった。
Discussion
本研究では、IPFと因果的に関連する血漿中遺伝子発現およびDNAメチル化部位を特定。
3つの遺伝子(BTRC、RIPK4、LINC01252) と 5つのメチル化部位(cg00045227、cg00577578、cg07163735、cg14222479、cg19263494) がIPFリスクと関連。
肺組織のeQTLデータを用いて、MUC5BおよびDSPのIPFリスクに対する因果効果を検証し、手法の信頼性を確認。
BTRC:
BTRCはβ-TrCP1をコードし、NLRP3のプロテアソーム分解を促進。
NLRP3はIPF患者で過剰活性化されており、BTRCの発現増加がIPFリスク低下に寄与。
RIPK4:
炎症シグナルと細胞死に関与し、NF-κB活性化を促進。NF-κBはコラーゲン蓄積を促進し、肺線維症に寄与。
RIPK4の発現増加がIPFリスク上昇に関連。
LINC01252:
長鎖非コードRNAであり、発現増加がIPFリスク低下に関連するが、機能的研究が不足。
DNAメチル化:
cg00045227(OR8U8)、cg00577578(GBAP1)、cg07163735(MAPT)、cg14222479(ARPM1)、cg19263494(PMF1)のメチル化レベルがIPFと因果的に関連。
これらの部位のメカニズムは未解明で、さらなる研究が必要。
本研究の強み:
血漿中eQTL、mQTL、pQTLデータを統合し、SMRを含む6つのMR手法で因果解析を実施。
感度および共局在化解析により、結果の堅牢性を検証。
欧州系集団を対象とし、異なる遺伝的背景によるバイアスを最小化。
限界:
eQTLおよびmQTLデータに性染色体情報がない。
pQTLデータの成熟度不足により、IPFとの因果的関連は得られず。
MR検証でのIVの不足により、感度と異質性の解析が不十分。
性別や年齢別の個別データを取得できず、他の集団への結果の一般化に限界。
Quantitative Trait Loci (QTL) for genesとは、特定の**量的形質(quantitative traits)**に影響を与える遺伝子領域を指す。量的形質とは、身長、体重、血圧、遺伝子発現量などのように、数値で測定できる形質である。
QTL解析では、以下のような流れで解析を行う:
ゲノム領域の特定:
ゲノム全体を対象に、形質に影響を与える遺伝子マーカー(通常はSNP)と、形質値との関連を探索する。
結果として、特定の遺伝子や遺伝子群が量的形質に関連することが示される。
遺伝子発現QTL (eQTL):
遺伝子の発現量に影響を与えるQTL。
例えば、特定のSNPがあると、ある遺伝子の発現量が上昇する、または低下することが分かる。
DNAメチル化QTL (mQTL):
DNAメチル化レベルに影響を与えるQTL。
SNPがDNAのメチル化状態を変化させる場合、それが形質に影響を与えることがある。
タンパク質発現QTL (pQTL):
血漿や組織中のタンパク質レベルに影響を与えるQTL。
タンパク質の量が変化することで、特定の疾患や形質に関連することがある。
QTL解析は、疾患リスクや遺伝的感受性の因果的な要因を特定するための重要なツールであり、遺伝的変異がどのように形質に影響を与えるかを理解するために用いられる。
Summary-data-based Mendelian Randomization (SMR) analysisは、疾患や量的形質(例:遺伝子発現、DNAメチル化、タンパク質レベル)に対する因果的な関連を評価する統計手法の一つである。SMR解析は、**メンデルランダム化(Mendelian Randomization; MR)の一種であり、主にゲノムワイド関連解析(GWAS)**のサマリーデータを利用して行われる。以下、SMR解析の主な特徴と手順を説明する。
SMR解析の特徴
因果関係の推定:
SMRは、遺伝的変異(通常はSNP)がある形質(例:遺伝子発現、DNAメチル化、タンパク質レベル)に与える効果を介して、疾患や他の量的形質にどのように影響を与えるかを調べる。
この手法は、因果推論を可能にし、特定の遺伝子や分子が疾患にどのように関与するかを理解するのに役立つ。
操作変数(Instrumental Variables; IVs)としてのSNP:
MR解析では、SNPを操作変数として使用し、形質と疾患の因果関係を推定する。SMRは、同様の考え方を用いながら、サマリーデータを活用している。
サマリーデータの使用:
SMRは、個々の被験者データを必要とせず、GWASから得られたサマリーデータを用いる。
これにより、大規模なデータセットの解析が可能になり、計算コストも低くなる。
SMR解析の手順
サマリーデータの収集:
まず、遺伝子発現やDNAメチル化、タンパク質レベルに関連する量的形質座(QTL)データを用意する。
さらに、疾患に関するGWASのサマリーデータも必要である。
SMR解析:
SMRでは、SNPが形質(遺伝子発現、DNAメチル化など)に与える効果と疾患に与える効果を統合して解析する。
**2段階最小二乗法(2SLS)**を用いて、形質が疾患に与える因果効果を推定する。
結果として、形質が疾患に因果的に関連しているかどうかを評価する。
HEIDIテスト:
SMR解析では、共局在化(colocalization)の影響も検討する。
HEIDIテスト(Heterogeneity In Dependent Instruments)は、SNPと形質、疾患の関連が共有因果変異によるものか、それともリンクのみによるものかを判別するために用いられる。
SMR解析の意義
SMR解析は、疾患の潜在的な治療標的の発見やバイオマーカーの特定に役立つ。
サマリーデータを用いることで、広範なデータセットを利用し、因果推論を効率的に行うことができる。
SMR解析は、特定の遺伝子や分子が疾患に与える影響を明確にし、疾患の病因理解や新しい治療法の開発に貢献することを目的としている。