ABO遺伝子型は豚のGalNAcレベルを調節することにより腸内細菌叢を変化させる
公開日:2022年4月27日
ABO遺伝子型は豚のGalNAcレベルを調節することにより腸内細菌叢を変化させる
Hui Yang, Jinyuan Wu, ...Lusheng Huang 著者を表示する。
Nature 606, pages358-367 (2022)この記事を引用する
17k アクセス数
12件の引用
91 Altmetric
指標詳細
概要
腸内細菌叢の構成は個人差が大きく、健康状態との相関がある1。宿主の遺伝子がこの変動にどの程度、どのように寄与しているかを理解することは重要であるが、特にヒトでは再現された関連性がほとんどないため、困難であることが分かっている2。 ここでは、大規模モザイク豚集団における腸内細菌叢の組成に対する宿主遺伝子型の影響を研究している。遺伝的多様性と環境の均一性が悪化した条件下で、微生物叢の構成と特定の分類群の存在量は遺伝することを示す。また、ブタ科の菌の存在量に影響を与える量的形質座をマッピングし、それがヒトのABO血液型を支えるN-アセチルガラクトサミニルトランスフェラーゼをコードする遺伝子における2.3kbの欠失によって引き起こされることを明らかにした。我々は、この欠失が350万年以上前の種を越えた多型であり、平衡選択を受けていることを示す。この欠失は腸内のN-アセチルガラクトサミン濃度を低下させ、N-アセチルガラクトサミンを輸入して異化できるエリシペロトリカスの個体数を減少させることを証明した。この結果は、宿主の遺伝子型が腸内の特定の細菌の存在量に影響を与えるという非常に強い証拠であり、この関連性を支える分子メカニズムに関する洞察を与えるものである。このデータは、農村部の人間集団においても同じ効果を確認するための道を開くものである。
要旨
生物の生理・病理を包括的に理解するためには、宿主とその複数の微生物叢を統合的に解析する必要があることが、ますます認識されてきている1。ヒトでは、腸内細菌叢の組成は、HDLコレステロール、空腹時グルコース値、肥満度などの生理的・病理的パラメーターと関連していることが分かっている2。家畜では、ルーメンのマイクロバイオーム組成は、メタン生成および飼料効率と関連しています3。これらの相関関係は、宿主とマイクロバイオータの複雑な相互作用を反映しており、マイクロバイオームが宿主の生理機能に直接的な(因果関係のある)影響を与える可能性があります4。微生物叢の構成と相関するいくつかの表現型は遺伝性である5,6。このことから、宿主の遺伝子型がマイクロバイオータの組成を部分的に決定し、それが宿主の表現型に影響を与える可能性があるという仮説が導き出された4。このことは、微生物叢の組成は部分的に遺伝することを示唆している。げっ歯類における研究はこれを裏付けているが7、ヒトにおける証拠はあまり説得力がない。初期の報告では、二卵性双生児と比較して一卵性双生児では微生物叢の類似性が高くなかったことから、宿主の遺伝子型の影響は限定的であることが示唆された8。より強力な研究により、宿主の遺伝が分類群、特にクリステンセネラ科の存在量に大きな影響を与えるという証拠が得られた9。微生物叢の遺伝性を支える遺伝子座をヒトで同定することは、依然として困難である。ラクターゼの持続的発現を引き起こすバリアント(LCT)やビフィズス菌の減少に関連するものを除けば、他のGWAS遺伝子座は再現が困難であることが判明している2,10,11,12,13,14。微生物叢組成の遺伝的構造をより深く理解するためには、より大規模なヒト集団の解析が必要である。
そこで、大型単胃雑食動物における腸内細菌叢組成の遺伝的構造を明らかにするために、モザイクブタ集団を作製し、その腸内細菌叢の縦断的特性評価を行ったことを報告する。その結果、宿主の遺伝子型が微生物叢の組成に強く影響し、腸内のN-アセチルガラクトサミン濃度を制御することでこの代謝物を炭素源とするいくつかの種に影響を与え、特定の分類群の存在量に大きな影響を与える遺伝子座を同定することができた。
複雑な形質を研究するためのモザイクブタ集団
中国4品種と西洋4品種の61のF0ファウンダーの子孫を10世代以上にわたって交配し、大規模な(>7,500)モザイク集団を作り出した(補足表1および拡張データ図1)。動物は均一な住居と給餌条件で飼育された。最大954頭のF6動物と892頭のF7動物について、200以上の表現型(体組成、生理、耐病性、行動に関わる)を解析し、複数の組織からトランスクリプトーム、エピゲノム、クロマチン相互作用データを取得し、血漿メタボロームとマイクロバイオームのデータを収集した。F0動物は平均28.4倍の深さで全ゲノム配列が決定され、F6とF7動物は平均8.0倍の深さで配列が決定された。2380万個の一塩基多型(SNP)と640万個の挿入欠失(indel)で、マイナーアレル頻度(MAF)が0.03以上(>1/100 bp)の遺伝子型を呼び出した。中国産2品種間およびヨーロッパ産2品種間の塩基多様性(π)(すなわち、2品種の相同配列間で異なる塩基部位の割合)は、Homo sapiensとHomo neanderthalensis間のそれに近い(〜3 × 10-3)15が、中国産1品種とヨーロッパ産1品種間のπはヒトとチンパンジー間の半分(約 4.3×10-3)16 に近づいていることが示された。F6とF7に含まれる8つの創始者ゲノムの割合は、ゲノムレベルでは11.2%から14.7%、染色体レベルでは4.9%から22.1%の範囲であった。指標となるバリアントと高い連鎖不平衡(LD)(r2 ≥ 0.9)にあるバリアントの数の中央値は30、高いLD(r2 ≥ 0.9)にあるバリアントとの最大距離の中央値は54 kbだった(拡張データ図1)。
健康な豚の腸内細菌叢
25日目(哺乳期)、120日目(成長期)、240日目(屠殺日)の糞便、240日目の大腸・回腸内容物(F6、F7)、大腸・回腸粘膜削り(F7のみ)を採取した(7サンプルタイプ、12データ系列)。1データシリーズあたり平均426匹(5,110サンプル)の16S rRNAタグ(V3-V4)を作成した(補表2.1)。タグは希薄化され、32,032の操作的分類単位(OTU)にクラスタリングされた。リードの98.7%に相当する12,054 OTUを保持し、41 phyla、87 classes、149 orders、207 families、360 genera、150 speciesにアノテーションされました。12のデータ系列の平均的な微生物相組成は、F6とF7で高い一貫性を示したが、サンプルの種類によって顕著な違いがあった(図1a、b、補足表2.2)。ファミリーレベルでも、いくつかの分類群はサンプルタイプにほぼ特異的であることがわかった(Extended Data Fig.) プロテオバクテリアのEnterobacteriaceae、Pseudomonadaceae、Pasteurellaceae、ファーミキューテスのClostridiaceae、Peptostreptococcaceae、Bacillaceae、Leuconostocaceae、アクチノバクテリアのMicrobacteriaceaeは回腸サンプルに他のサンプルタイプの10倍以上多く含まれていた。その中で、Leuconostocaceaeはほぼ消化管に、Pseudomonadaceaeはほぼ粘膜に特異的であった。25日目の糞便では、Bacteroidetes OdoribacteraceaeとRikenellaceaeが他のどのサンプルタイプよりも少なくとも10倍以上多く検出された。また、Christensenellaceae(クリステンセネラ科)の固形細菌は、他のどのタイプのサンプルよりも、糞便サンプルに10倍近く多く含まれていた。このことは、腸内細菌叢の解析を成人の糞便に限定すると、その複雑さとそれを決定する要因について部分的な見解しか得られないことを裏付ける17。 糞便のα-多様性は120-240日目に比べて25日目に低く、ヒトにおける小児期と成人期の腸内細菌相の濃縮を彷彿させる8, 18。回腸内容物は、大腸内容物や粘膜よりもα-Diversityが低かった(図1c)。β-Diversityはα-Diversityに反比例する傾向があり、120日目および240日目の糞便よりも25日目の糞便で高い値を示した。Bray-Curtis非類似度のばらつきは、α-diversityが最も低い回腸内容物で最も大きかった(図1dおよび補足表2.3)。豚240日目(D240)糞便の微生物相組成は、マウス糞便よりもヒト糞便に類似していた(Extended Data Fig.2)。
図1: 健康なブタの腸内細菌叢。
図1
a, 5,110 個の 16S rRNA プロファイルの共同主座標解析(PCoA)。F6 25日目の糞(D25、モーブ)、120日目の糞(D120、赤)、240日目の糞(D240、緑)、回腸内容物(IC、水色)、盲腸内容物(CC、濃紺)(左図)。中、左のプロットで説明した通りだが、F7について。右はF7の回腸内容物(IC、水色)、盲腸内容物(CC、紺色)、回腸粘膜(IM、ピンク)、盲腸粘膜(CM、茶色)。 b, 12データ系列の平均微生物相組成図。少なくとも1つのデータシリーズで上位15位までに含まれる43のファミリーをハイライトしている。対応する門と科の名称はキーに示されている。ヒトの糞便106サンプルとマウス(C57BL/6)の糞便6サンプルの平均組成を示した。箱ひげ図は、中央値(中心線)、四分位範囲(箱限界)、四分位範囲の1.5倍の範囲(ひげ)、外れ値(点)を示す。 d, aと同様に色付けした12のデータ系列のβ-多様性値(対ブレイ・カーティス距離)。サンプル番号と箱ひげ図はcで説明した通り。
フルサイズ画像
モザイク豚における微生物叢の遺伝性
まず、遺伝的近縁性(ゲノムワイドSNP同一性)と微生物叢非類似性(ブレイ・カーティス距離、全分類群合計)の関係を調べた2。 遺伝と環境の交絡を軽減するために、2つのアプローチを用いた:(1)同じ環境で育てられた同胞に分析を限定した、(2)世代間(F6とF7)の遺伝的類似と微生物叢非類似を対峙させる、であった。どちらのアプローチも、遺伝的類似性と微生物相の非類似性の間に有意な負の相関があることから、微生物相組成に対する遺伝の影響を支持した(図2a、b)。
図2:モザイク豚の微生物叢組成の遺伝性。
図2
a, リッター内のゲノムワイド親族関係(Θ)とマイクロバイオーム非類似度(Bray-Curtis距離)の相関関係。相関関係(スピアマンのr)は、12のデータ系列について別々に測定した。P値(片側)は並べ替えにより計算した。調整後のr値は12個中11個で並べ換え値の50パーセンタイル以下であった(P = 0.0029)。rの経験的P値(片側)は、2つのデータ系列で≦0.05/12=0.004(ボンフェローニ補正)であった。P値を12個のデータ系列で合計すると、全体のP値は3×10-4となった。各データシリーズについて、使用した産子数(l)と動物ペア数(n)を示す。 b, ゲノムワイド親族関係とマイクロバイオーム非類似度(ブレイ・カーティス距離)の世代間相関。F6 と F7 のペアの可能性をすべて考慮した(母豚と子豚のペアは含まない)。F6とF7の両方で測定した5つの形質について分析を行った。r、p、nはaで述べたとおりである。r値は、分析した5つのサンプルタイプについて並べ替え値の50パーセンタイル以下だった(P = 0.03)。rの経験的P値(片側)は、1つのサンプルタイプで≦0.05/5=0.01(ボンフェローニ補正)であった。c, 試料タイプ(左)または分類レベル(右)でソートした個々の分類群の遺伝率の頻度分布。F6とF7の合同分析で得られた値。 d, 標本の種類と分類レベルで計算した遺伝率の合計2.
フルサイズ画像
次に、F6 と F7 を用いて個々の分類群/OTU の存在比の遺伝率(h2)を評価した(図 2c および補表 3.1)。また、総遺産率(豊度によって重み付けされた平均的な遺伝率)2 は、標本の種類と分類群レベルで別々に計算された。総遺 伝子は概ね低い値(≦11.8%)であったが、糞便(平均D240、10.2%)では内容物サンプル(平均回腸内容物、5.7%)より高く、OTU(平均、6.6%)では高分類群レベル(平均、7.5%)より低い(図 2d) 。F6とF7で別々に得られたh2^推定値の相関は、D120 (P = 4.2 × 10-5), D240 (P = 2.2 × 10-16) と盲腸内容物 (P = 2.3 × 10-3) で正で有意で、真の遺伝効果を支持した (Extended Data Fig. 3). F6 (≥0.15), F7 (≥0.15), F6 と F7 にまたがる (≥0.10) の一致した h2^ 推定値に基づいて、最も遺伝性の高い 55 の分類群/OTU のリストを確立した(補足表 3.1)。D240糞便にはCampylobacterales目、D25糞便にはBacteroides coprophilus種、53OTUのうち、Christensenellaceaeに2個(D240糞便、盲腸内容)、Ruminococcaceaeに5個(D240糞便に4個、盲腸内容1個)、Ruminococcusに1個(D25)、Phascolarctobacteriumに1個(D25)、RF32に1個(D240)割り付けられていた。すなわち、h2 ≥ 0 で特徴づけられる分類群である。 10であることを特徴とする分類群である19。RF32を除き、これらはすべてClostridiales目に属している。
Erysipelotrichaceaeの種に影響を与えるmiQTL
遺伝率は、相加的な遺伝的分散の割合を定量的に示すが、遺伝的構造を予言するものではない。遺伝率の低い表現型は、大きな影響を持つバリアントによって影響を受ける可能性があるが、遺伝率の高い形質は、非常に多系統である可能性がある。この集団における腸内細菌叢組成の遺伝的構造に関する洞察を得るために、ゲノムワイド関連研究(GWAS)を実施した。我々は、分類群の存在量と分類群の有無に対するSNP効果をそれぞれ検定する2つの統計モデルを適用した11。サンプルタイプ、分類群、世代別にGWASを実施し、合計57,557のGWAS(8,490の分類群を含む)を得た(補表4.1)。その結果、1,527のゲノムワイドな有意なシグナル(P≦5×10-8)が得られた。これらについて、F6とF7に分けて、サンプルタイプ横断的にメタ解析を行った(Extended Data Fig.4)。その結果、一方のコホートでは実験全体の発見閾値(P = 1.5 × 10-12)を超えるシグナルが、他方のコホートでは実験全体の再現閾値(P = 0.007)を超えるシグナルが6個確認された(図3aおよび補表4.2-4.3)。すべてのリードSNPは互いに3,037 bp以内(第1染色体)にマッピングされ、高いLDを示した(図3b)。これらは2つのOTU(OTU476とOTU327)、およびOTU476が属するp-75-a5属に影響を及ぼしていた。3つともErysipelotrichaceaeである。
図3:Erysipelotrichaceaeの種に影響を与えるmiQTL。
図3
a, F6とF7におけるOTU476のゲノムワイドメタ解析の結果(サンプルタイプによらず)。b, F6とF7におけるOTU476とOTU327の1番染色体(272.8-273Mb)の局所拡大図。c, F6(x軸)とF7(y軸)におけるSNP 1_272907239と8,490 OTUの存在量との関連について、すべてのサンプルタイプ、2つの解析方法(存在量と存在/不在、2つのOTU476値を説明)(左)においてlog[1/P]値を示した。p-75-a5とErysipelotrichaceaeに属するOTUは、それぞれ赤と黄色で示されている。右、p-75-a5とErysipelotrichaceaeのOTUの関連性(1_272907239)P値の分布をF6とF7の他のOTUと比較したもの。ボックスプロットはFig.1cで説明した通り。ボックスの切り欠きは中央値の95%信頼区間に対応する。分布はWilcoxonの順位和検定で比較した。c, F6とF7における上位4つのSNPと2.3kbのABO欠失の間のLD(r2)。
フルサイズ画像
このマイクロバイオータQTL(miQTL)が他の分類群に影響を与えるかどうかを調べるために、リードSNP 1_272907239と8,490の研究対象OTUのF6とF7の関連log[1/P]をプロットしてみた。OTU476とOTU327はF6とF7で非常に有意であることが目立った(図3c)。しかし、他の31のp-75-a5 OTUと他の83のErysipelotrichaceae OTUのP値は、両方のコホートで低いP値に向かって有意にシフトし(図3c)、その符号はOTU476、OTU327、p-75-a5のそれと一致した(Extended Data 図4)。このことは、1番染色体miQTLがこのファミリーの他の種に影響を与えることを示唆している。特に、p-75-a5とOTU476のh2はD240(0.10と0.14)とD120(0.13と0.13)の糞便で0から大きく外れ、OTU327のh2推定値はD120糞便(0.13)だった(補表4.4)。
1番染色体の変異体(272.8-273.1Mb区間)を除去して得られたQQプロットは、log[1/P]の残留インフレーションの納得できる証拠を示さなかった(Extended Data Fig.4)。したがって、残存h2は高度に多系統である可能性が高い。
ブタABOオルソログの350万年前の欠失
すべてのリードSNPは、ヒトのABO血液型の基礎となるブタのN-アセチルガラクトサミニルトランスフェラーゼ遺伝子の3′末端にマッピングされている(図3b)。この遺伝子は、いくつかの病原体との相互作用を調節する有力な候補であり20、最近、健康なヒトの腸内細菌叢に影響を与えることが示唆された21,22,23。ブタでは、最後のエキソンを包含する2.3 kbの欠失が報告されている24。我々は、この欠損が我々の集団のリードSNPsとほぼ完全なLD(r2 ≥ 0.94)であることを示した(Fig. 3d)。我々はその境界を確認し、それがshort interspersed nuclear element(SINE)間の染色体内組換えに起因することを示した。また、F7盲腸300サンプルを用いたRNA-sequencing (RNA-seq) と発現定量形質座位 (eQTL) 解析により、欠損対立遺伝子は、8つの活性部位のうち7つを含む62%のアミノ酸を失ったタンパク質をコードする7.4 kbの転写産物を減少した量(通常の約1/3)生産することを示した25 (Fig. 4a). この結果は、2.3 kbの欠失がヌルアレル(以下、Oアレル)を作り、それが原因となるmiQTL変異の非常に強い候補であることを示している(拡張データ図5および図6)。
図4: ブタのABOオルソログの350万年前の欠失がmiQTLを引き起こす。
図4
a, ブタのAO血液型遺伝子の構造。61匹のF0動物の遺伝子型をIGV(Integrated Genome Viewer)で見ると、2.3kbの欠失にまたがる約5kbの区間に145の変異があることがわかる。上の2つの赤い長方形は2.3kbの欠失を示す。ホモ接合型alternative(水色)、ヘテロ接合型(紺色)、ホモ接合型reference(灰色)の遺伝子型が示される。水平の青い矢印は染色体内組換えを仲介しているSINEをマークしている。垂直の黒い矢印は、図3bのトップバリアントを示している。2.3kbの欠失がアセチルガラクトサミニルトランスフェラーゼ転写物に及ぼす影響(代替エクソン8と9の生成、転写レベルの正常の約1/3への減少を含む)を示す。A対立遺伝子の効果はO対立遺伝子の効果よりも優位であり、miQTL効果は盲腸(内容物と粘膜)、120日目と240日目の糞便サンプルで検出される。サンプルサイズは補足表4.1に記載されている。c, 2.3kb欠失を中心とする5kbウィンドウにおける14AAと34OOの動物間の配列類似性に基づく算術平均デンドログラムによる非重み付けペアグループ法. CHは中国、EUはヨーロッパ、RUはロシア、DOMは家畜豚、WBはイノシシ、PHAC_AFRはイボイノシシ、SUS_VERRはジャワイボイノシシ、SUS_CEBはビサヤイボイノシシ、SUS_SCR_VIIはスマトライボイノシシ。品種は BX, Bamaxiang; EH, Erhualian; LA, Laiwu; LD, Landrace; LW, Large White; PT, Piétrain; TB, Tibetan; WD, White Duroc. d, ブタのAO遺伝子(青)の2.3kb欠失(赤)と重なる集団分化の減少のピーク。1番染色体上の位置をX軸に、2kbのスライディングウィンドウ内の全バリアントの1/(平均F統計量)をY軸に示す。F統計量は、O対立遺伝子の投与量に関する品種間平均二乗と品種内平均二乗の比として計算した。Chr.は染色体。
フルサイズ画像
AO遺伝子型がOTU476、OTU327、p-75-a5の存在量に及ぼす影響を検討した。その結果、(1)A対立遺伝子の影響はO対立遺伝子よりも優勢であること(補足表5.1)、(2)その影響はD120とD240の糞便、大腸内容物および粘膜に現れるが、D25の糞便とD240の回腸内容物と粘膜には見られないこと(図4bと補足表5.1)などが明らかにされた。これらの試料(D120, D240, 盲腸内容物, 盲腸粘膜)において、AO遺伝子型はOTU476、OTU327、p-75-a5属の存在量の変動の7.9%、3.2%、6.6%を説明した(Supplementary Table 5.2).特に、OTU476とOTU327の存在量は、大腸内容物で最も高かった(AA/AO動物ではリードの約0.92%と0.02%、OO動物ではリードの約0.47%と0.003%、 Extended Data Fig.5)。
霊長類では、ABO遺伝子座は強い平衡選択下にあり、ヒト、テナガザル、旧世界ザルでは数千万年前から同一の対立遺伝子が分離して存続してきた26。我々は、AO遺伝子にまたがる50kbのウインドウにおいて、61匹のF0(Sus scrofa domestica)、18匹のイノシシ(アジア9、ヨーロッパ9)(Sus scrofa)、スマトラ島産インドネシアイノシシ1(Sus scrofa vittatus)、フィリピン産ビシャポン1(Sus cebifrons)、インドネシア産ジャワンイボシシ(Sus verrucosus)およびアフリカ産イボイボ(Phacochoerus africanus)1匹の塩基配列を分析した。アジアとヨーロッパのイノシシは約100万年前(Ma)に共通のS. scrofaの祖先から分岐し、S. scrofaとS. s. vittatusは約1.5 Ma、S. scrofaとS. cebifron/verrucosusは約3.5 Ma、S. scrofaとP. africanusは約10 Ma27に分岐している。2.3kbの欠失は8種のF0品種すべて、アジアと欧米のすべての野生イノシシ集団、およびS. cebifronsで分離した(補表5.3)。欠失のブレイクポイントの配列はすべてのサンプルで同一であり、ブタOアレルのidentical-by-descent性を確認した(Extended Data 図7)。ハイブリダイゼーションではなく、祖先の種を越えた多型という仮説と一致して、S. cebifronsのOアレルはS. scrofaのOアレルのクラスターの外に位置していた(図4cおよびExtended Data 図7)。さらに、AO遺伝子は2.3kbの欠失で最大となる集団分化の著しい減少を示した(Fig.4d)。このように、ほとんど知られていないが、少なくとも2つの哺乳類の分岐(霊長類とイヌ科)において、実質的に長期間、広い地理的範囲にわたって選択的な力が働いており、その浸透性を示唆している(Extended Data 図7)。
miQTLは糞便中のGalNAc濃度に影響を及ぼす
ヒトと同様、ブタのAO遺伝子は広く発現しているが、特に腸で発現している(Extended Data 図7)。A対立遺伝子にコードされるN-アセチル-ガラクトサミニル転移酵素は、N-アセチル-D-ガラクトサミン(GalNAc、α1-3結合)を、腸内細菌が炭素源とする重グリコシル化ムチンなどの糖基質上のHおよびルイス抗原に付加する20, 28, 29 (Extended Data Fig. 8)。我々は、腸管粘液が豊富であることから、O対立遺伝子は腸内のGalNAc濃度を低下させ、それによってこの糖に依存する細菌種の増殖を抑えているのではないかと推論した。我々は、D240の278頭(F7が124頭、Duroc × Landrace × Large Whiteが154頭)の盲腸内容物中の遊離GalNAc、N-アセチルグルコサミン (GlcNAc) およびN-アセチルマンノサミン (ManNAc) 異性体(以下HexNAc)濃度を液体クロマトグラフィー結合タンデム質量分析装置 (LC-MS/MS) で測定した。ブタの腸内HexNAcは、GlcNAcとGalNAcの異性体がほぼ等しい割合で存在する30。A対立遺伝子を投与すると(相加モデル)、糞便中のHexNAc濃度が増加した(P = 5.7 × 10-9)(図5a)。この増加がGalNAcのみに起因すると仮定すると(A対立遺伝子の酵素活性を考えると)、AA動物はOO動物と比較して少なくとも2倍の遊離GalNAcを持つことになる(図5aおよび拡張データ図9)。OO動物におけるゼロでない値は主にGlcNAc/ManNAcによるもので、非A抗原宿主と食餌性GalNAcにも起因すると考えられる(GalNAcは腸ムチンを含むすべてのO-グリカンのコアに偏在し、コンドロイチン硫酸などのグリコサミノグリカンの構成要素である)。A対立遺伝子の効果は細菌量には支配的であるが、GalNAc濃度には相加的であることに注目したい(相加モデルに対する尤度比検定のP値 = 0.12)。このことは、AA動物(対AO動物)におけるGalNAc利用可能性の追加的増加は、OTU476、OTU327およびp-75-a5の増殖にさらに有利ではないことを示す。
図5: miQTLはGalNAc濃度の増加によって作用し、GalNAcを利用する細菌に影響を与える。
図5
a, AO遺伝子型が糞便内容物のGalNAc濃度に及ぼす影響 (nAA = 33, nAO = 118, nOO = 127)。濃度はバッチ効果で補正し、0と1の間でスケーリングして残留分散を均等化した。遺伝子型対比のP値(両側および名目)は、Wilcoxonの検定を用いて計算した。b, AO遺伝子型内のGalNAc濃度とOTU476の存在比の相関。GalNAcの曲線下面積(AUC)値をバッチ効果およびAO遺伝子型について補正し、上記のようにスケーリングした。スピアマンの相関のP値(名目、両側)が示されている(P = 0.012)。c, bと同じで、動物をAO遺伝子型別に色分けした。 d, OTU476様株のGalNAc輸送と異化の経路。GalNAc-6-P, N-アセチルガラクトサミン-6-リン酸; GalN-6-P, ガラクトサミン-6-P; Tag_6-P, タガトース6-リン酸; Tag-1,6-PP, タガトース1,6-二リン酸; GAP, グリセルアルデヒド3リン酸; DHAP, ジヒドロキシアセトンリン酸; 3PG, 3-リン酸グリセロール ; Pyr, ピルビン酸 ; ラク: 乳酸. GalNAcオペロンにコードされる酵素は青色で示した。e, OTU476様株(4-8-110)に13Cラベル(赤)対通常のGalNAc(緑)を与えたときのGC-MSで測定した13Cラベル代謝物の割合。 f, In vivo(無菌マウス)大腸菌対OTU476様株のGalNAc添加・無添加競争。4-8-110と大腸菌の純粋培養液を強制接種した10匹の無菌マウス(Kunming系統)の盲腸内容物と糞便中の、4-8-110参照rRNA配列対大腸菌rRNA配列にマッピングした16S rRNAリードの割合(つまり、図に示した割合から1を引いたものが、大腸菌16S rRNAにマッピングしたリードに相当)、GalNAc付き(赤バー)とPBS(緑のバー)比較。存在量の差を比較するP値(名目、両側、補正なし)は、Wilcoxon検定を用いて決定した。
フルサイズ画像
O欠失は、(1)糞便中のGalNAc濃度を下げ、(2)OTU476、OTU327およびp-75-a5の存在比を下げるが、一方が他方を引き起こすという証明にはならない。細菌の存在量に対する効果は、GalNAcとは無関係の未同定のメカニズムによってもたらされている可能性がある。しかし、GalNAc濃度の変化が細菌数の変化を引き起こすという仮説は、検証可能な予測を立てる。この場合、AO遺伝子型の影響を遮断し、GalNAcと細菌数の他の変動源を利用することで、GalNAc濃度と細菌数の「内」相関が「残存」することが期待できる(拡張データ図8)。これらの解析を行った結果、OTU476 (P = 0.012) とp-75-a5 (P = 0.010) について、3つの遺伝子型(AA、AO、OO)内で一貫して、予測された正の相関が観察された。また、より量の少ないOTU327では、有意ではないものの(P = 0.3)正の相関が見られた(図5b、cおよび拡張データ図9)。
これらの結果を総合すると、AO遺伝子型が腸内のGalNAc濃度に影響を与え、それがいくつかのErysipelotrichaceae種の存在量に影響を与えるという強い主張が成り立つ。
miQTLに応答する細菌はGalNAcを利用する
腸内細菌がGalNAcを炭素源として利用するためには、(1)分泌型グリコシドヒドロラーゼ(GHs)により糖鎖構造から遊離され、(2)専用の輸送系(TR)により細菌膜を越えて輸入され、(3)特定の異化経路(CP)で中枢代謝の中間体に転換されることが必要である。特定の単糖に対してGHとTR-CPの両方を持つ細菌もいるが、GH(供与体)またはTR-CP(受容体)のみを持つ細菌もいる28。我々は、miQTLに反応する細菌は、完全なGalNAc TR-CPシステム(GHの有無にかかわらず)を持っているだろうと推論した。これを検証するために、(1) OTU476とV3-V4の配列類似度がそれぞれ100%と99.8%の2つの細菌株(4-8-110と4-15-1)を分離し、Oxford Nanopore Promethionシステムでゲノム配列を決定し、 (2) Erysipelotrichaceae 248株を含む豚腸試料92個のショットガンデータからメタゲノム集合ゲノム(MAG)を3,111個構築した。その結果、GalNAcの利用に関与する24の遺伝子(TR-CP)28,31,32,33,34,35,36がリストアップされた。これらは、(1)3つのGalNAcトランスポーターシステムの11個の構成要素(AgaPTS: agaE, agaF, agaV, agaW; TonB依存性トランスポーター: omp, agaP, agaK; GnbPTS: gnbA, gnbB, gnbC, gnbD)、(2)2つのGalNAc-6Pデアセチラーゼ(agaA, nagA)、(3)2つのガラクトサミン6P(GalN-6P)アイソメラーゼおよび/またはデアミナーゼ(agaI, agaS)、(4)3つのタグトース6Pキナーゼ(pfka, lacC, fruK), (5) 4つのタガトース-1,6-PPアルドラーゼまたはアルドラーゼサブユニット (gatY-kbaY, gatZ-kbaZ, lacD, fba) (6) 2つのレギュロンリプレッサー (agaR, gntR), 計6つが必須の経路構成要素である (Fig. 5d and Supplementary Table 6)。5dおよび補足表6)。特定の糖の利用に関わる遺伝子は、TR-CPの必須ステップのすべて、あるいはほとんどを支える共役遺伝子(レギュロン)からなるオペロンを形成し、集積する傾向がある。オペロンにコードされていないステップは、基質特異性の低い酵素をコードする遺伝子によってトランスで補完される可能性がある37,38。2つのOTU476様ゲノムと3,111個のMAGから、24遺伝子のオーソログを検索した。我々は、細菌種がGalNAcを利用する能力を評価するために2つのスコアを作成した。一つ目のスコア(パスウェイスコア)は、地図上の位置に関係なく、ゲノムで検出されたオルソログによって達成されうるGalNAc利用の必須ステップの数(6つのうち)をカウントした。第二のスコア(regulon score)は、ゲノム上でクラスター化している、つまりオペロンを形成している可能性のあるオーソログが果たすことのできるGalNAc利用の必須ステップの数を数えたものである。agaSをアンカー遺伝子として、レギュロンスコアを設定した28。まず注目すべきは、agaSの少なくとも1つのオルソログが、2つの(つまりすべての)OTU476様株、Erysipelotrichaceae MAG(n = 248)の31%で見つかり、しかし他のMAG(n = 2,863)ではわずか2.9%であることであった。2つ目は、いずれのスコアも、Erysipelotrichaceaeが他のMAGに比べて有意に高く(Ppathway = 2.0 × 10-16, Pregulon = 2.0 × 10-16)、OTU476様2株がErysipelotrichaceaeと非Erysipelotrichaceae MAGの合計に比べて(Ppathway = 2.2×10-3, Pregulon = 1.2×10-5) (拡張データ図10)、また、ErysipelotrichaceaeがMAGの2倍も高く、Otu3様2株がPpathawayを有していた(Extended Data図11)。2つのOTU476様株は、AgaPTSトランスポーター系の4つのコンポーネント(agaE, agaF, agaV, agaW)、nagAデアセチラーゼ、agaSデアミナーゼ/アイソメラーゼ、fruKキナーゼ、gatZ-kbaZアルドラーゼサブユニットのオルソログなど8つのGalNAc遺伝子から構成されているクラスターによって特徴付けられた(Extended Data Fig.10).これはパスウェイ、レギュロンともに5点で、それぞれ3,113個のMAGのうち上位4.7%と0.35%に相当し、OTU476様株がGalNAc利用に関して珍しい存在であることが示された。4-15-1および4-8-110ゲノムは、いずれもA抗原に特異的なα-N-アセチルガラクトサミニダーゼ活性を持つことが知られているGHをコードしておらず39,40,41、これらの菌株はアクセプターのみであることが示唆された。
OTU476様株がGalNAcを輸入して異化できることを確認するために、4-8-110株を13C-ラベルGalNAc存在下で培養し、細菌ペレット中の13C-ラベル異化物の出現をガスクロマトグラフMS結合(GC-MS)により確認した。13時間培養後、約29%のグリセルアルデヒド-3-Pと約25%のジヒドロキシアセトンリン酸(gatZアルドラーゼによるタガトース-1,6-ビスリン酸の変換産物)が13C標識されており、4-8-110株によるGalNAc利用が実証された。3-ホスホグリセリン酸の約23%と乳酸分子の約17%が13C標識されたが、TCA代謝物は全く標識されず、この嫌気性細菌では酸化的リン酸化よりも解糖が優勢であることが明らかになった(図5d, e)。
さらに、GalNAcの添加がin vivoでの4-8-110と大腸菌の相対的増殖に及ぼす影響を調べるために、無菌マウスを用いた経口摂取実験を行った。マウスにGalNAc(200 mg kg-1 live weight、AAブタと同等の糞便GalNAc濃度を得る;Extended Data Fig.9)またはリン酸緩衝生理食塩水(PBS)、および大腸菌と4-8-110 OTU476様株の混合物を与えた。12日目にマウスを安楽死させ、盲腸と糞便中の16S rRNA シークエンスを用いて大腸菌と4-8-110株の相対存在量を測定した。4-8-110株はPBS投与マウスでは検出されなかったが、GalNAc投与マウスの盲腸では平均0.9% (P = 0.0079) および糞便では0.7% (P = 0.0097) のリードを占めた (Fig. 5f).
miQTL感受性の高い細菌のGalNAcオペロン
少なくとも65のMAG(大腸菌と他の非Erysipelotrichacea種を含む)は、4-15-1と4-8-110と同様に5つの重要なGalNAc TR-CPステップのオルソログを含んでいる。我々は、なぜ1番染色体miQTLがこれらの種に影響を与えないのか不思議に思っていた。彼らのGalNAcオペロンの構成がヒントを与えてくれるかもしれない。エリシペロトリカス科以外の種のGalNAcクラスターは、本物のレギュロンの特徴を持っている。関連するORFは互いに隣接し(約10kbに及ぶ)、同じ鎖上にある傾向があり、共時的な発現を可能にするポリシストロンmRNAに適合している。一方、2つのOTU476様株と少なくとも1つのErysipelotrichaceaeのGalNAcクラスターのオープンリーディングフレーム(ORF)はそれぞれ約50kbと30kbに及び、両鎖に分布している。どちらのゲノムにも、GalNAcレギュロンのネガティブレギュレーターであり、他の全てのGalNAc-rich MAGsで観察されるagaRとgntRのオルソログは含まれていなかった(図6a、拡張データ図11参照)。このことは、大腸菌などとは異なり、OTU476様株や一部のエリシペロトリス科細菌はGalNAc濃度を感知して必要な時だけGalNAc利用に必要な遺伝子の発現を誘導することができず、むしろこれらを構成的に発現している可能性を示唆している33, 35,36. この仮説を検証するために、2つのOTU476様株と大腸菌をGalNAcを含む培地と含まない培地で培養し、RNA-seqを用いてそのトランスクリプトームを解析した。大腸菌のGalNAcレギュロンは、GalNAc非存在下ではほぼ完全に転写が停止し、存在下では約300倍にアップレギュレートされ、厳密に制御されていた。一方、OTU476様4-15-1株では、GalNAc TR-CP遺伝子は、予想通りGalNAcの有無に関わらずほぼ等しいレベルで発現していた。GalNAc非存在下での4-15-1株の発現レベルは、GalNAc存在下での大腸菌の発現レベルより高かった。4-8-110株の発現パターンは大腸菌と4-15-1の中間であった:GalNAc遺伝子はGalNAc非存在下で(低レベルではあるが)発現していたにもかかわらず、その存在下では(約5から10倍)アップレギュレートされていた(図6a)。OTU476様株と大腸菌のGalNAc添加に対するトランスクリプトームの応答の違いは、GalNAcオペロンに限った話ではない。大腸菌ではGalNAc添加はGalNAcレギュロン以外の遺伝子には顕著な影響を与えなかったが、4-15-1と4-8-110ではそれぞれ≥605と225の遺伝子(q ≤ 0.05)の発現を変化させた(図6b)。その結果、両株で6つのKEGGパスウェイが摂動した(FDR ≤ 0.05):代謝経路、ピリミジン代謝、アラニン、アスパラギン酸、グルタミン酸代謝、抗生物質の生合成、ABCトランスポーター、二次代謝産物の生合成(補足表7)。
図6: miQTL対応菌のGalNAcオペロン構成とトランスクリプトーム応答。
図6
a, OTU476様株と大腸菌におけるGalNAcオペロン組織とGalNAc付加に対する局所的なトランスクリプトーム応答。上, GalNAcオペロン組織。同定されたORFはカラーボックスで表されている。GalNAcの輸入と異化に関与する遺伝子は、クラスターの一部である場合は赤で、ゲノムの他の場所にある場合は緑で示されている。GalNAcとは無関係の機能が知られている遺伝子は青色で示した。遺伝子産物が解明されていないORFは灰色で示した。遺伝子の頭文字は対応するボックスの横に記した。上側と下側の鎖から転写されるORFはそれぞれ点線の上と下に示されている。それぞれの転写方向は矢印で示されている。下、成長培地中にGalNAcを添加した場合(濃い色)と添加しない場合(薄い色)の局所遺伝子発現レベル(100万マップリードあたりのエクソンモデル1kbあたりの断片数(FPKM))。機能が分かっているORF(GalNAc遺伝子(赤)、その他の遺伝子(青))の色は、上のパネルと同じである。エラーバーは、3つの複製からのs.e.m.である(個々の値はドットで示されている)。 b, OTU476様株と大腸菌におけるGalNAc添加に対するグローバルなトランスクリプトーム応答。培地中にGalNAcを添加した後のそれぞれのゲノム中の全遺伝子(大腸菌では4,419、OTU476様株では1,119、ゲノム位置によりランク付け)の発現量の対数2変換した倍率を示す。GalNAc遺伝子は赤で、その他の遺伝子は青で示した。挿入図:大腸菌ではGalNAc制御以外の遺伝子への影響がほとんどないのに対し、OTU476様株では広範囲に渡って反応があることを示す対応するQQプロット。QQプロットの作成に用いたP値は名目上のものであり、DISEQ2を用いて決定した。
フルサイズ画像
考察
ヒトにおいて、ABO 遺伝子型は、様々なウイルス(SARS-CoV-1 および 2 を含む)、細菌および原虫の病原体に対する感受性に影響を与え、またおそらくは腸内細菌叢の構成に影響を与える20,42,43。誘発されるメカニズムは通常、病原体の接着、毒素の結合、可溶性デコイ、自然抗体など、免疫に関連したものである26,44。本研究で報告されたmiQTLは、腸内のGalNAc濃度に影響を与え、それによってGalNAcを利用する細菌の増殖に影響を与えることによって機能するという強力な証拠を提供するものである。不可解な発見は、GalNAcを炭素源として利用する能力を持つ全ての種が影響を受けているわけではないことである。このことは、GalNAcオペロンが大腸菌のような種では誘導性であるのに対し、少なくともOTU476様株の一部では高レベルで構成的に発現しているという観察結果と関連している可能性があることを示唆する。OTU476様株に見られるGalNAc遺伝子群は、大腸菌に見られるような真のレギュロンの形成に向けた進化的中間体である可能性があり、まだ適応的に共役していなくても、「利己的」機能遺伝子アンサンブルの水平伝播を容易にするものである37。4-15-1株と4-8-110株のGalNAcオペロンのGalNAcに対する特異的な挙動は、正規のリプレッサーに基づくレギュロンシステムとは異なる進化した制御機構を示しているのかもしれない。これらの知見は、miQTLの別の作用機序を示唆するものである。その影響を受ける細菌は、GalNAcが腸内容物中に比較的高い濃度で存在する場合(AAおよびAO動物のように)有利ではなく、むしろGalNAcが低濃度で存在する場合(OO動物のように)、無用な遺伝子の転写と翻訳のためにエネルギーを浪費して不利となる可能性がある。GalNAcの利用可能性に応じてオペロンの発現を厳密に制御することによって、大腸菌のような種はAA/AO豚の腸内でもOO豚の腸内と同様に良好に働き、したがってmiQTLの影響を受けないのかもしれない。GalNAcオペロンの構成が異なることに加え、OTU476様株のトランスクリプトームは、大腸菌のそれよりもGalNAc添加に反応することに注目したい。この観測の正確な意義はまだ確立されていないが、miQTLに対する感受性の違いを支える代替的あるいは付加的な因子を示しているのかもしれない。
FUT2-null対立遺伝子は、ヒトおよびホモ接合体において分離する。これは、非O型個体においてI型H抗原の合成を妨げ、したがってI型A/B抗原のエピスタシーを妨げる20, 21 (Extended Data Fig. 8)。FUT2H117R変異体は我々の集団で分離されたが、AO遺伝子型に条件付けした場合としない場合の、OTU476、OTU327、p-75-a5の存在量に対するそのほかのFUT2変異体の影響を示す証拠はなかった(データは示されていない)。
ABO遺伝子型がヒトの腸内細菌叢の構成に及ぼす影響については、依然としてやや議論のあるところである。小規模なコホート(n = 71)では、微生物叢に基づいてAB型とB型、A型とO型に分離したクラスタリングを示唆する証拠があったが45、その後の大規模コホート(n = 1,503) の研究では、腸内微生物叢組成に対するABO遺伝子型の実験全体に及ぶ有意な影響は検出されなかった46。さらに最近、ドイツ人約9,000人のコホートにおいて、FaecalibacteriumとBacteroidesにそれぞれ割り当てられたOTUの存在量に対するABO遺伝子型の効果が報告されたが21、その後の研究(約18,000人)47では確認されなかった。我々は、ヒト腸内試料中のErysipelotrichaceaeに属する約75のOTUの存在量に対するABO血液型の影響を調べた(Extended Data Fig.12)。ヒトで検出されたOTUはいずれも、ブタのOTU476、OTU327、p-75-a5と同じように近縁であった。また、ABO血液型がこれらの存在量に影響を及ぼしている証拠は見つからなかった。ブタとヒトの違いの根底にあるものは不明である。ABO遺伝子型に感受性のあるErysipelotrichaceae株がヒトには十分なレベルで存在しないか、あるいはヒト腸管内容物の炭水化物組成がこれらの株をGalNAc濃度の変動に感受性の低いものにしているのであろう。p-75-a5の存在量は、アフリカの生業カテゴリーによって大きく異なり、おそらく家畜との相互作用の結果として(狩猟採集民や農耕牧畜民と比較して)牧畜民で最も多いことが明らかにされた48,49。牧畜民で実験を繰り返すことで、本研究で検出されたのと同じmiQTL効果が明らかになるかもしれない。
この論文の発表が最終段階にある間に、異なる分類群ではあるが、ABO遺伝子型がヒトの腸内細菌叢の構成に影響を与えるという2つの論文が発表された22,23。
方法
動物の飼育と試料採取
本研究では、以下のように作成したモザイク個体群の第 6 世代(F6)および第 7 世代(F7)を対象とした。中国の 4 つの土着豚品種(EH)、BX)、TB)、LA)および欧州・米国の 4 つの商業豚品種(LD)、 LW)、WD)、PT)から平均 3.6 頭の猪(範囲は 3-4) と 4 頭(範囲は 2-5) が交配に成功し、F0 世代を構成している。それぞれの中国品種について、猪とヨーロッパ品種の母豚、母豚とヨーロッパ品種の猪を交配し、F1世代を作出した。したがって、中国品種とヨーロッパ品種はそれぞれ2つの異なるF1雑種の組み合わせの親品種となり、合計8つのF1組み合わせ(BX-LW, BX-PT, LA-PT, LA-LD, TB-LD, TB-WD, EH-WD, EH-LW)が存在することになる。F2世代は,各F1雑種の組み合わせと親品種を共有しない他の2つの組み合わせとを交配して,合計8つのF2組み合わせ(BX-LW × LA-PT, BX-PT × LA-LD, LA-PT × TB-LD, LA-LD × TB-WD, TB-LD × EH-WD, TB-WD × EH-LW, EH-WD × BX-LW, EH-LW × BX-PT )を得て,F1世代は,親種族が共有しない各F2組み合わせを,交配して得られた.すべてのF2組み合わせは、一方のF1組み合わせから平均4頭の猪を他方の母豚から平均7.25頭の猪と相互交配することによって得られた。F3世代は、8つのF2雑種組み合わせのそれぞれを、親品種を共有しない唯一の相補的なF2組み合わせと交配することによって得られた。F2の組み合わせから平均7頭の牡牛を、相補的な組み合わせから平均10.8頭の母豚と相互に交配して、すべてのF3組み合わせが得られた。F4、F5、F6、F7世代は、猪57頭×母豚75頭(F3→F4)、猪62頭×母豚97頭(F4→F5)、猪85頭×母豚170頭(F5→F6)、猪82頭×母豚111頭(F6→F7)により交雑させた(付表1)。
F6およびF7はすべて江西農業大学豚遺伝子改良生産技術国家重点実験室(江西省南昌市)の実験農場で生まれ、標準的で均一な住居・飼料条件のもとで飼育された。子豚は哺乳期間中は母親と一緒に過ごし、約46日齢で離乳した。子豚は自動給餌器(Osborne Industries)付きの12頭用肥育ペンに移し、子豚の分割・合併を最小限に抑えた。すべての豚に1日2回、粗タンパク質16%、可消化エネルギー3,100 kJ、リジン0.78%、カルシウム0.6%、リン0.5%を含む配合飼料を給与した。水はニップルドリンカーからアドリビタブルで供給された。雄は80日目に去勢した。糞便サンプルは、25日、120日、240日齢の実験豚の直腸から手動で採取し、2mlのチューブに分注し、液体窒素で瞬間凍結して-80℃で保存した。動物は240日目に屠殺された。回腸と盲腸の両端を滅菌ロープで密封し、枝肉から取り出した。屠殺後30分以内に回腸および盲腸の管腔内容物を採取し(F6およびF7動物)、回腸および盲腸を滅菌生理食塩水で洗浄し、回腸および盲腸粘膜のサンプルを滅菌顕微鏡用スライドで擦り取った(F7動物のみ)。約1gの内容物または掻取りを2mlの滅菌フリーザーチューブに詰め、液体窒素で瞬間凍結し、-80℃で保存した。さらなる分析に利用できる異なるタイプのサンプルの数を補足表2.1に示す。分析に含まれる動物はすべて健康で、サンプル採取後1ヶ月以内に抗生物質による治療を受けていない。動物を含むすべての手順は、江西農業大学の倫理委員会によって承認された(番号JXAU2011-006)。
F0、F6、F7 世代のシークエンスによる遺伝子型判定
ゲノム DNA は、標準的なフェノール-クロロホルムベースの DNA 抽出プロトコルを用いて耳かきから 抽出した。DNA 濃度は Nanodrop-1000 装置(Thermo Fisher Scientific)を用いて測定し、すべてのサンプルの DNA 品質はアガロース(0.8%)ゲル電気泳動で評価した。ゲノムDNAは300-400bpの断片サイズにせん断した。3′末端をアデニル化し、指標となるプライマーをライゲーションした。ライブラリーは、Phusion High-Fidelity DNA polymerase(NEB)を用いて、メーカー(Illumina)の推奨に従ってPCRにより増幅された。ライブラリーをIllumina X-10装置(Illumina)にロードし、Novogeneによる2×150 bpペアエンドシーケンスを行った。50%以上の塩基の品質スコアが20以下、または10%以上の欠損(N)塩基を持つリードを削除した。リードの品質はFastqc (http://www.bioinformatics.babraham.ac.uk/projects/fastqc/) を用いてチェックした。BWA (v.0.7.17) を用いて、S. scrofa reference genome assembly 11.150 にクリーンリードをアライメントした51。BAMファイルはSAMTools (v.1.6)を用いて染色体上の位置でソートした52。インデルの再調整と重複のマーキングはPicard (v.2.21.4, http://broadinstitute.github.io/picard)を用いて行った。BAMファイルからPlatypus (v.0.8.1) を用いて個々の遺伝子型をコールした53。個々の遺伝子型を PLINK (v.1.9)54 を用いて単一の VCF ファイルに統合し、31,094,663 個の SNP と 8,266,390 個の INDEL を含む合計 3930 万個のバリアントを包含させた。欠落した遺伝子型はBeagle (v.40)でインプットされた55。MAF < 0.03のゲノムバリアントは削除された。
ヌクレオチド多様性の計算
品種間のヌクレオチド多様性は、バリアント頻度から以下のように計算された。
πi=(∑j=1ni1-(fAij×fBij)-((1-fAij)×(1-fBij)))/w
ここで、πiはウィンドウiのヌクレオチド多様性、niはウィンドウiのバリアントの数、fAijは品種Aにおけるウィンドウiのバリアントjの頻度、fBijは品種Bにおけるウィンドウiのバリアントjの頻度、wはウィンドウのサイズ(塩基対)である。品種AとBの組の全体のヌクレオチド多様性は、すべての窓のπiの平均として計算されました。報告された数値は、100万塩基対のウィンドウサイズで計算された、複数の品種のペア(ヨーロッパ内、中国内、ヨーロッパ間、中国間、ヨーロッパ・中国間)の全体のヌクレオチドの多様性の平均値である。
F6、F7世代における創始者8品種の寄与をゲノム、染色体レベルで推定する。
F6世代とF7世代における創始者8品種のゲノムに占める割合をref.56に従って推定した。56. モザイク集団で分離する変種の総数がnTであるとする。これらの変種はそれぞれ創始品種における頻度を持ち、品種1ではf0.11→f0.1nT、品種2ではf0.21→f0.2nTとし、F6(またはF7)世代における頻度をf61→f6nTと呼ぶことにします。全部で B 品種あると仮定する。F6(またはF7)世代における品種1のゲノム比率をP1,F6(またはF7)世代における品種2のゲノム比率をP2,...と表記する.P1、P2などの値は、一次方程式を用いて推定した。
f61=∑Bj=1(Pj×f0.j1)
⋮
f6i=∑Bj=1(Pj×f0.ji)である。
⋮
f6nT=∑Bj=1(Pj×f0.jnT)とした。
標準的な最小二乗法(Rのlm関数)を用いて、残差二乗和を最小化するPjの解を求めました。これは、ゲノム全体、および、常染色体ごとに行いました。
16S rRNAのデータ収集と処理
微生物DNAは、QIAamp Fast DNA stool Mini Kitを用い、製造元の推奨に従って、糞便、管腔内容物、粘膜擦過物から抽出した(Qiagen)。DNA濃度はNanodrop-1000装置(Thermo Fisher Scientific)を用いて測定し、DNA品質はアガロース(0.8%)ゲル電気泳動で評価した。16S rRNA遺伝子のV3-V4超可変領域はバーコード融合プライマー(338F: 5-ACTCCTACGGAGGCAGCAG-3, 806R: 5-GGACTACHVGGTWTCTAAT-3)でアニール温度56℃にて増幅させた。精製後、PCR産物はライブラリーの構築に使用し、メジャーバイオ社のIllumina MiSeqプラットフォーム(Illumina社)でシーケンスした。16S rRNAのシーケンスデータはCNGBデータベースに提出され、アクセッション番号CNP0001069を有する。16S rRNA遺伝子シーケンスの生リードをデマルチプレックスし、Trimomatic (v.0.39)57 を用いてプライマーとバーコードの配列をトリミングした。10塩基以上連続した同一塩基またはあいまいな塩基を持つリードは除去した。FLASH (v.1.2.11) を用いて、きれいなペアエンドリードをタグにマージした(最小10 bpのオーバーラップ)58。1サンプルあたりの平均タグ数は約40,888個であった(補表2.1)。キメラリードはUSEARCH (v.7.0.1090) を用いて除去した59。配列データは、サンプルあたりのタグ数が最も少ない19,632タグに希釈した。タグは、VSEARCH (v.2.8.1)60 を用いて、類似度の閾値として 97% を用いて OTU にクラスタリングしました。少なくとも2サンプルで3リード以上ない、あるいはサンプルの0.2%以下で検出されるようなOTUは無視した。最終的に、サンプルあたりの総リードの平均98.7%を占める12,054個のOTUをさらなる解析に使用した。12,054のOTUの平均タグ数は1.6 (range, 0.01- 702.2)であった。OTUはGreengenes (v.13.5) データベースとRDP分類器 (v.2.2) を用いて分類群にマッチングさせた61。PCoA は ape and vegan R package (v.3.5.3) を用いて、Bray-Curtis 非類似度を用いて実施した。α-多様性指標としてShannon's indexを用い、mothur (v.1.43.0) を用いて計算した62。β-多様性指標としてブレイ・カーティス非類似度を用い、Rのveganパッケージのvegdist (v.3.5.3)を使用して計算した。マウスの糞便マイクロバイオームデータは、ref. 63. ヒトの糞便マイクロバイオームデータは、106人の健常者の16S rRNAデータである(L.S.ら、原稿準備中)。
微生物叢組成の遺伝率の測定(全分類群合計)
まず、ゲノムワイド親族関係とマイクロバイオーム非類似度の相関を測定することで、腸内細菌叢の組成に対する宿主遺伝の影響を推定した。GEMMA (v.0.97)64 または GCTA (v.1.26)65 を用いて、上記の 3,020 万の DNA バリアントにおける SNP 遺伝子型を用い、関連する個体のすべてのペアについてゲノムワイドキンシップ(Θ)を計算し た。両プログラムとも標準化後のΘの推定値は同じ分布であったが、生データは異なっていた。我々はGEMMA (v.0.97)を用いて得られた結果を報告する。マイクロバイオームの非類似度は、vegan R関数66を用いて計算したBray-Curtis非類似度と全OTUの存在量から測定した。R (v.3.5.3) の corrtest 関数を用いて Spearman (rank-based) の相関を計算した。我々はまず、各サンプルの種類と世代について、litter内で別々にこの分析を行った。つまり、同じlitter内で生まれた全兄弟のペアのみを考慮し、したがって本質的にはref.67に従ったものである。67. 次に、F6世代とF7世代に渡って分析を行った。このとき考慮した個体のペアは、F6-F7のすべての動物ペアであり、親と子のペアは含まれない。データを特徴づける依存性を考慮し、P値は並べ換え検定によって経験的に決定された。親子関係係数とBray-Curtis非類似度については、1,000回の並べ替えを行った。OTU存在量のベクトルをリター内で並べ替え、Bray-Curtis距離を再計算し、並べ替え前のキンシップと相関させた。経験的P値は、実データで得られた相関と同等かそれ以下のスピアマンの相関を得た並べ替えの割合として決定された。
個体群存在比の遺伝率の測定
lme4QTL R-package (v.3.5.3) を用いて線形混合モデルを実装し、特定の分類群/OTUの対数変換された存在量の遺伝率を推定した68。遺伝率の推定値の P 値は lrt_h2 関数68 を用いて計算した。まず、F6世代とF7世代の情報を合わせて遺伝率を推定した(F6+F7)。モデルは動物個体(つまり多遺伝子効果)、ダム、リッター、ペン、バッチをランダム効果として、世代を固定効果として含んでいる。動物個体間の効果の共分散を決定する加法的遺伝関係行列は GCTA (v.1.26)65 を用いて計算された。このF6+F7解析は、(1)F6動物間(F6内)、(2)F7動物間(F7内)、(3)F6とF7動物間(F6とF7間)の血縁と表現型の類似性の相関から情報を抽出するものである。また、これらの3つの情報が整合しているかどうかを評価するために、各分類群またはOTUについて、3つの遺伝率を別々に推定した。F6とF7の遺伝率は、F6+F7解析と同じ混合モデル(固定世代効果がないことを除く)とlme4QTLパッケージを使って推定した。F6とF7間の遺伝率は、ref. (2001)に従って、豊度の二乗差を加法関係に回帰することにより推定した。69-狭義の遺伝率は、β^を最小二乗回帰係数、σ^2Pを表現型分散の推定値とし、-β^/(2σ^2P)として推定した(Extended Data Fig.3)。腸内細菌群の遺伝率は、文献2に従い、個々の分類群/OTUの遺伝率と存在量からさらに計算された。
miQTLのマッピング
miQTLは、GenABEL Rパッケージ(v.3.5.3)70を用い、ref.11に従って2つのモデルを適用してマッピングされた。11. 1つ目は、対立遺伝子の投与量と対数10変換した分類群の存在量との間に線形回帰を適用したモデル(additive model)です。このモデルは、MAFが0.05以上のSNP(対応するデータシリーズ)と、少なくとも20%のサンプルで非ヌル存在量のある分類群(つまり、OTUを含むすべての分類レベル)に適用し、ヌル存在量のサンプルが5%以上であれば無視した。2つ目は、対立遺伝子の投与量と、対応するサンプルにおける分類群の有無の間のロジスティック回帰モデルを当てはめました(バイナリモデル)。このモデルは、20%以上95%以下の個体に存在する分類群およびMAF10%以上のSNPにのみ適用した(MAF<10%でこのモデルを使用すると、検定統計量がヌルの下で膨張したため;拡張データ図4)。両モデルとも、性別、屠殺バッチ(F6では21、F7では23)、3つの第1ゲノム主成分を固定共変量として含めた。GWASは各分類群×データ系列の組み合わせで別々に実施し、P値はゲノム制御による残差層別化で同時に調整した。P 値は Z スコアを用いて形質および/または分類群間で結合された。P 値は、標準正規分布の逆数を用いて符号付き Z 値に変換し、合計して Z スコアとした。Z スコアは当初 METAL (v.3.0) を用いて計算された71。形質間のあるコホートの表現型値の間に存在する相関を考慮しながら対応するZスコアのP値を計算するために、我々はまた、Zスコアのゲノム全体(つまり、テストしたSNPsのすべてにわたって)の平均(Z¯)と標準偏差(σZ)を計算した。ZスコアのP値は、帰無仮説のもとで(Z-Z¯)/σZがN (0,1)として分布すると仮定して、(保守的に)計算した。どちらのアプローチでも、同様の結果が得られた。
ブタAOアセチルガラクトサミニルトランスフェラーゼ遺伝子のAアレルのデノボアッセンブリー
Bamaxiangの雌の最長筋から、フェノールクロロホルムベースの抽出法(Novogene Biotech社)を用いて高品質のゲノムDNAを抽出した。40kb SMRTbell DNA library (Pacific Biosciences) をDNAサイズ選択用BluePippin (Sage Science) を用いて調製し、PacBio Sequel platform (Pacific Biosciences) でP6-C4 chemistryを用いてNovogene Biotechで塩基配列を決定した。合計18,148,470個のサブスレッドが得られ、N50長は17,273 bpであった。さらに、インサートサイズ350 bpのペアエンドライブラリーを構築し、Novogene Biotech社のIllumina Novaseq 6000 PE150プラットフォーム(2 × 150bp reads)でシーケンスした。PacBioリードは、Flye(v.2.4.2)でアセンブルする前にCanu(v.1.7.1)で自己修正した72。一次アセンブリのエラーは、まずracon (v.1.4.10) を用いてPacBioサブスレッドを修正し73、次にイルミナペアエンドリードをbwa-mem74を用いてコンティグにマッピングし、Pilon (v.1.23, Broad Institute) 75を用いてコンティをポリッシュしました。Lastz (v.1.02.00)76 と Minimap2 (v.2.17-r941)77 を用いて、Bamaxiang コンティグと S. scrofa build 11.1 reference genome の ABO 遺伝子にわたる 40 kb 配列を比較検討した。
AA、AO、OOブタを区別するためのPCRアッセイの開発
F6およびF7集団における欠失の遺伝子型を決定するために、2組のプライマーを設計した。最初のプライマー対は、ABO遺伝子のイントロン7内と欠失の下流にそれぞれ位置した(FP: 5′-GAGTTCCTTGTGGCTCAGT-3′, RP: 5′- TTGCCTAAGTCTACCCCTGTGC-3′ )。プライマーの第2の組は、エクソン8に位置した(FP2:5′-CGCCAGTCCTTCACCTACGAAC-3′、RP2:5′-CGGTTCCGAATCTCTGCGTG-3′)。PCR増幅は、50ngのゲノムDNAおよび1.5UのLA Taq DNAポリメラーゼ(タカラ)を含む25μl反応において、94℃、4分間;94℃、1分間、プライマーの各セットに対する特定のアニーリング温度で1分間、72℃、2分間の35サイクル;および72℃、10分間の熱サイクリング条件においてPE 9700 thermal cycler (Applied Biosystem) で実施された。
RNA-seq および eQTL 解析
微生物叢および遺伝子型データも有するF7ブタの盲腸組織サンプル合計300個を用い、製造業者のマニュアルに従って、TRIzol(Invitrogen)を用いて全RNAを抽出した。トータルRNAを1%アガロースゲルで電気泳動した。RNA の純度と完全性は、eNanoPhotometer spectrophotometer (Implen) と Bioanalyzer 2100 system (Agilent Technologies) を用いて評価した。RNA 濃度の測定には、Qubit3.0 Fluorometer (Life Technologies) を使用した。各サンプルのトータルRNA(2 µg)を、NEBNext UltraTMR NA Library Prep Kit for Illumina(NEB)を用いて、メーカーのプロトコールに従ってRNA-seqライブラリーの構築に使用した。オリゴ(dT)磁気ビーズ(Invitrogen)を用いてmRNAを濃縮し、断片化バッファー(Ambion、米国)を用いて断片化し、6bpランダムプライマーと逆転写酵素(Invitrogen)を用いてcDNAを合成した。精製後、cDNAを末端修復し、インデックスコードとシークエンスアダプターをライゲーションした。PCR増幅、精製、定量後、ライブラリーはNovaseq-6000プラットフォームで2×150 bpペアエンドシーケンスを用いて配列決定された。生データからアダプターリード、poly-N、低品質リードを除去し、クリーンデータを取得しました。各サンプルのクリーンリードは、STAR (v.020201)78 を用いて著者らが構築したABO遺伝子座のAアレルを持つBamaxiang参照ゲノムの完全ABO配列にマッピングされました。SAM形式からBAM形式への変換にはSamtools(v.1.6)52を用いた。ABO(エクソン1〜7)にマッピングされたリード数は、featureCounts(v.1.6.4)79を用いて、各サンプルごとに定量した。ABO遺伝子の発現量は、FPKMで正規化した。性別とバッチは遺伝子発現量を補正するための共変量として扱い、補正後の残差を以降の解析に使用した。GEMMA (v.0.97)64 を用いて、線形混合モデルを用いて ABO 発現量とゲノムワイド変異の関連を解析した。
イノシシ、S. verrucosus および S. cebifrons の全ゲノム配列決定とバイオインフォマティクス解析
ロシア産イノシシ6頭、スマトラ産イノシシ1頭、アフリカ産イボイノシシ1頭のゲノムをNovogene BiotechのIllumina HiSeq X Tenプラットフォームで配列決定した。さらに、6頭の中国産イノシシは以前の研究80で配列決定されており、他の8頭のブタのゲノム配列決定データはNCBIからダウンロードした。最後に、合計22のゲノムを用いて、GATK (v.4.2)81 を用いてブタのABO遺伝子のSNPsをコールした。S. scrofa build 11.1ゲノムのABO遺伝子を、ABO遺伝子のAアレルを含む50kbのBamaxiangコンティグ配列に置き換えた。22個体のクリーンアップリードをBWA (v.0.7.17) を用いて修正S. scrofa参照ゲノム (build 11.1) にアライメントした51。
Sus属におけるO対立遺伝子の系統解析
GATK (v4.2) を適用してindel realignmentを行い、GATK best practices recommendations81,82に従って、標準的なハードフィルタリングパラメータを用いて83サンプルすべてで同時にUnifiedGenotyperによるSNPおよびindel discoveryとgenotypingに進めた。我々は、14 AAと34 OO動物に分析を限定し、したがって、対応する遺伝子型を段階的に決定する必要性を回避した。2.3 kbの欠失を中心に、さまざまなサイズ(0.5~50 kb)のウィンドウを定義しました。すべてのペアの個体について、ウィンドウ内のすべての変異体について、両方の動物の遺伝子型がAA(代替)またはRR(参照)の場合は0を、一方の動物がAAで他方がRRの場合は1を加え、その他の場合はすべて0.5として、ランニングサム計算を行った。そして、対応する動物ペアの塩基多様性は、ランニングサム(running sum)をウィンドウサイズ(bp)で割った値として計算された。この計算では、2.3 kbの欠失に位置する変異体は無視した。その後、ペアワイズヌクレオチド多様性の行列は、算術平均による重み付けしないペアグループ法(UPGMA)に対応するR関数hclust (method="average") を使用して、階層的クラスタリングとデンドログラム構築に使用された。
集団分化の解析
標準的な一元配置分散分析固定効果モデルと、品種間平均二乗(BMS)と品種内平均二乗(WMS)の比として計算されるF統計量83を用いて、対立遺伝子投与量の分散に対する品種の効果を計算し、集団分化の度合いを定量化した。BMSとWMSは次のように計算された。
BMS=(∑i=1B∑j=1ni(yi¯¯-yT¯¯¯)2)/(B-1)
WMS=(∑i=1B∑j=1ni(yji-yi¯ ¯¯)2)/(NT-B)
ここで、yijは品種i(Bの)の個体j(niの)における対立遺伝子の投与量、yi¯は品種i(Bの)における平均対立遺伝子投与量、yT¯はデータセット全体における平均対立遺伝子投与量である。物理的な大きさを固定したスライディングウィンドウ(図5eでは2kb)内のすべての変種について、対応するF統計量の平均を計算し、この平均の逆数を集団類似性の指標とした。対応するプロファイルは、ref.84に従って変種間の平均FST値(固定指数)を計算し(逆数をとり)、得られたものとほぼ同じであった。84.
成体および胚の各組織におけるABO遺伝子発現レベルのプロファイリング
Bamaxiang成豚およびDuroc豚胚(75日目)から採取した15組織(肺、食道下部、皮膚、脊髄、肝臓、脾臓、筋肉、視床下部、心臓、血液、脳、盲腸、胃、十二指腸、腎臓)からTrizolを用いてTotal RNAを抽出した。RNA の品質はアガロース(1%)ゲル電気泳動でモニターし、Bioanalyzer 2100 system (Agilent Technologies) の RNA Nano 6000 Assay Kit を用いて測定した。RNA濃度は、Qubit 2.0 Flurometer (Life Technologies)のQubit RNA Assay Kitを使用して測定した。各サンプルの Total RNA (1 µg) を用いて RNA-seq ライブラリーを構築した。TruSeq RNA Library Preparation Kit (Illumina) を用いて、製造元の推奨に従ってシーケンスライブラリを作成し、インデックスコードを付加して各サンプルに配列を帰属させた。簡単に言えば、mRNAは、ポリTオリゴ付着磁気ビーズを使用して全RNAから精製された。ランダムヘキサマープライマーとM-MuLV Reverse Transcriptase (RNase H-)を用いて一本目のcDNAを合成した。残りのオーバーハングはエキソヌクレアーゼ/ポリメラーゼ活性によりブラントエンドに変換された。DNA断片の3′末端をアデニル化した後、Illuminaアダプターをライゲーションした。長さ350-400bp程度のcDNA断片を優先的に選択するために、ライブラリ断片をAMPure XPシステム(Beckman Coulter)で精製した。Phusion High-Fidelity DNA polymerase, Universal PCR primers and Index (X) Primer を用いてPCRを行った。PCR産物を精製し(AMPure XPシステム)、Agilent Bioanalyzer 2100システムでライブラリーの品質を評価した。インデックスコードされたサンプルのクラスタリングは、TruSeq PE Cluster Kit v3-cBot-HS (Illumia) を用いてcBot Cluster Generation System上でメーカーの説明書に従って実施されました。シーケンシングはIllumina NovaSeqプラットフォームで行い、150 bpペアエンドリードを生成した。アダプター配列、poly-N、低品質リードを除去し、フィルターをかけたリードを得た。クリーンアップされたリードは、HISAT2(v.2.2.1)85を用いてBamaxiang参照ゲノム配列の完全なABO配列にマッピングされた。SAM形式からBAM形式への変換には、Samtools (v.1.6)52 を使用した。各サンプルについて、ABO(エクソン1~7)に対応するリードカウントをfeatureCounts(v.1.6.4)79を用いて定量化した。シーケンスの深さの影響を調整するために、ABO遺伝子の発現量をTranscripts Per Million (TPM)で正規化した。Rパッケージstatsとdendextendに実装された関数dist(), hclust(), as.dendrogram(), set()を用いて、ABOの発現量を、Bamaxiang成豚とDuroc豚胚の15組織の発現レベルのクラスタリングと視覚化に使用した。
AO遺伝子型が他の表現型に及ぼす影響の検証
2.3 kb ABO欠失と150の形質との関連は、F6とF7集団において、効果を組み合わせたメタ分析に基づいて計算された。形質に対する観察されたP値は、F6世代とF7世代のZスコアの加重平均を以下のように検定することによって算出された。Z = (Z1W1 + Z2W2)/(W1 + W2), Z1 = b1/SE1 and Z2 = b2/SE2, W1 = 1/(SE1)2 and W2 = 1/(SE2)2, ここで添え字1および2はそれぞれF6およびF7世代を表す; b1、b2、SE1およびSE2は、全ゲノムマーカーの遺伝子型から得られるゲノム関係行列を用いて集団構造を説明した線形混合モデルから推定された、与えられた形質に対するABO遺伝子座の加法効果および標準誤差であった。F6世代で250、F7世代で254の形質が検定され、F6世代とF7世代で共通する150の形質がメタ解析に用いられた。
糞便内腔のN-アセチルガラクトサミン濃度の測定
ターゲットとなるLC-MS/MS分析を行い、糞便内腔サンプル中のGalNAc、GlcNAcおよびManNAc異性体の混合物(HexNAcと称する)の濃度を測定した。Duroc × Landrace × Large Whiteの商業集団から124頭のF7と154頭について、D240で糞便内容物のサンプルを採取した。サンプルは凍結乾燥し、ミキサーミルMM400(30Hz、1分)(Retsch社製)で粉末に粉砕し、使用するまで-80℃で保存した。約15 mgの粉末を秤量し、500 µlの70%メタノール/水で抽出した。混合物を10分間ボルテックスし、約16,000g、4 ℃で10分間遠心分離を行った。上清(300μl)を新しい遠心管に移し、-20℃で30分間置いた後、再び16,128g、4℃で3分間遠心分離した。最後に、さらなるLC-MS分析のために上清を150 μl採取した。分離は、ExionLC AD System (AB Sciex) の 50 mm × 2.1 mm × 1.8 µm ACQUITY UPLC BEH C18 Column (Waters) で行った。リニアイオントラップおよびトリプル四重極スキャンは、ESI Turbo Ion-Spray インターフェースを備えた Applied Biosystems 6500 Triple Quadrupole (QTRAP 6500) システムで実施しました。操作はポジティブイオンモードで行い、Analyst ソフトウェア (v.1.6.3) (Sciex) で制御しました。ESIソースのパラメータは次のように設定した:イオンソース。イオン源:ESI+、ソース温度:550 550 ℃、イオンスプレー電圧 (IS): 5,500 V (Positive)、カーテンガス (CUR): 35 psi。GalNAcは、Multiple reaction monitoringを用いて分析した。GalNAc標準物質の増加量と既知量を用いて標準曲線を確立し、それを用いて乾燥した糞便内容物1グラムあたりのGalNAc濃度を測定した。
AO遺伝子型内のGalNAc濃度と細菌量の相関を測定する。
生のAUC (GalNAc) または細菌量は、平均と分散の両方に関して、かなりのバッチ間変動を示した。そこで、バッチ内のランクに変換し、これを0と1の間で一様に投影したところ、平均0.5、標準偏差≒0.3(バッチ補正後のランク)の均等化された値が得られた。次に、AO遺伝子型内でも同様の方法で、バッチ補正順位をスケーリングし、バッチ補正順位と遺伝子型補正順位を得た。GalNAcと存在量の尺度別ランクの間のスピアマンの相関を計算した。
4-8-110と4-15-1の単離
糞便サンプルは、約120日目の健康な豚の直腸から採取し、直ちに嫌気条件下へ移した。新鮮なサンプルは、10%の水素、10%の二酸化炭素、80%の窒素を含む嫌気性グローブボックス(Electrotek)内で滅菌1×PBS(pH7.0)を用いてホモジナイズした。糞便懸濁液を10-6、10-7、10-8、10-9倍に希釈し、GAM培地(日水製薬)にプレーティングした。プレートは嫌気性グローブボックス内で37℃、3日間培養した。GAM培地上で純粋なコロニーが得られるまで、シングルクローンを摘出し、ストリークした。全長16S rRNA遺伝子配列決定は、以下のプライマーを用いて増幅した後に行った:27フォワード:5′-AGTTTGATCCTGGCCTCAG-3′;および1492リバース、5′-GGTTACCTTGTTACGACTT-3′)。分離株は、さらに使用するまで、16%のグリセロールを含むGAMブロス中で-80℃にて保存した。
オックスフォード・ナノポアシーケンス
4-8-110 株および 4-15-1 株は、GAM 培地上で回収した。細胞は対数増殖期で回収した。ゲノムDNAは、Blood & Cell Culture DNA Midi Kit (Qiagen)を用いて、メーカーのプロトコルにしたがって抽出した。株の全ゲノム配列決定のためのライブラリーを構築し、NextOmics社のONT PromethION (Oxford Nanopore Technology)で配列決定した。また、シーケンスエラーを修正するために、2株それぞれについて第2世代シーケンス用ライブラリーを構築し、BGISEQプラットフォーム(BGI社)でシーケンス(2 × 100 bp)した。シークエンスデータのバイオインフォマティクス解析は、refs.72,86 に従って行った。72,86. すなわち、品質管理後、配列データはflie (v.2.6)72 を用いてパラメータ:--nano-rawでアセンブルし、アセンブルしたゲノムはOxford Nanoporeデータと第二世代の配列データをpilonを用いてデフォルトパラメータで結合して修正した。コードされた遺伝子はprodigal (v.2.6.3) (parameter: -p none-g 11)を用いて予測した87。
MAGアセンブリ
8つの豚集団、4つの腸内位置、異なる年齢から得た合計92の糞便サンプルを、メタゲノム配列決定とMAGの構築に使用した。微生物DNAは上記のように抽出した。メタゲノム配列決定のためのライブラリーは、製造元の説明書(Illumina)に従って、各サンプルについて350 bpのインサートサイズで構築し、NovaSeq 6000プラットフォームで2×150 bpペアエンドの配列を決定した。生シーケンスデータは、fastp (v.0.19.41)88 を用いてアダプター配列と低品質リードを除去するためにフィルターにかけた。ホストゲノムDNA配列はBWA(v.0.7.17)51を使用してフィルタリングした。各サンプルのクリーンリードは、MEGAHIT (v.1.1.3) を用い、オプション '--min-count 2 --k-min 27 --k-max 87 --k-step 10 --min-contig-len 500' 89 でコンティグにアセンブルされた。シングルサンプルメタゲノムのビン化は、metaWRAPパッケージ(v.1.1.1)を用いて、2種類のビン化アルゴリズム '--metabat2 --maxbin2' で行った90。2種類のビニングアルゴリズムで生成されたビン(MAG)を品質評価し、metaWRAP(v.1.1.1)のbin_refinementモジュールを使用してMAGセットを形成するように結合しました。メタゲノム配列は、metaWRAPパイプラインのmetaSPAdes (v.3.15.3) のreassemble_binsモジュールを使用して、MAGを最適化するためにさらにアセンブルされました。CheckM(v.1.0.12)を用いて、各MAG91の完全性と汚染度を推定した。完全性が 50%未満、汚染が 5%以上の MAG はフィルタリングにより除外した。冗長性のないMAGは、dRep (v.2.3.2) を用いて、平均塩基同一性 (ANI) 99%を閾値として生成した92。
バイオインフォマティクス解析
MAG の遺伝子予測は、metaWRAP (v.1.1.1) の annotate_bins モジュールを用いて実施された。コーディング遺伝子から翻訳されたアミノ酸配列のFASTAファイルを用いて、KEGGウェブサイト(https://www.kegg.jp/ghostkoala/)のGhost KOALAツール(v.2.2)93を用いて、KEGGアノテーションを実施した。MAGの分類はPhyloPhlAn (v.0.99)94を用いて行った。図 5b, c のグラフは、カスタム Perl (v.5.10.1) および R スクリプト (v.3.5.3) を用いて作成した。パスウェイおよびレギュロンのスコアは、カスタムPerlスクリプトを使用して計算した。両スコアとも、(1)インポート(AgaPTSの4成分(agaE, agaF, agaV, agaW)および/またはTonB依存トランスポーターの3成分(omp, agaP, agaK)のいずれか、またはGnbPTSトランスポーターの4成分(gnbA, gnbB, gnbC, gnbD)のいずれかの正ローグを持っているか)に対して1ポイント、(2)GnbPTSトランスポーターの3成分(opp, gbC, omp)のいずれかに対して2ポイントを獲得しました。(2) GalNAcデアセチラーゼ活性(agaA及び/又はnagaAのオーソログを有する)1点、(3) GalNデアミナーゼ/アイソメラーゼ(agaSのオーソログを有する)1点。(4)タガトース-6-Pキナーゼ(pfkAおよび/またはlacCおよび/またはfruKのオーソログを有する)に対して1点、および(5)タガトース-1,6-PPアルドラーゼ(gatYおよび/またはgatZおよび/またはlacDおよび/またはfbaのオーソログを有する)に対して1点を有すること。パスウェイのスコアでは、オーソログはMAGのどこにあってもよく、レギュロンのスコアでは、同じ配列コンティグ上にあり、アンカー遺伝子agaS28に近接(ゲノムサイズの2.5%)していなければならない。トップヒットについては、2つ以上のMAGで順序が再現されていること、および/または、1つの同じ配列コンティグ上に遺伝子が共局在していることによって、近接性が確認されているかどうかを手動で確認した。MAGの種類(OTU476-like、Erysipelotrichaceae、その他)、補完、コンティグ、ゲノムサイズがパスウェイとレギュロンのスコアに与える影響をRのlm関数で推定したところ、非常に有意であった。また、Erysipelotrichaceae とその他の対比の P 値は、lm 関数から直接求めた。OTU476-like 対 Erysipelotrichaceae + othersのP値を保守的に推定するために、完成度、コンティグ数、ゲノムサイズで補正したスコア残差を作成し、OTU476like株と同等以上のスコアを持つMAGが何個あるか判定した。Extended Data Fig. 10で報告されているP値は、同じGalNAcクラスター構成を持つOTU476様株が2つ存在することから、これらの割合の二乗に相当する。
GC-MSによる13C実験からの代謝フラックス比の決定
13CラベルGalNAc (N-acetyl-D-[UL-13C6]galactosamine) (13Cの同位体純度99%)は、ZZBIO社(上海)より購入した。4-8-110株を、1g l-1の13C標識GalNAcまたは通常のGalNAc(コントロールとして)を加えた6 mlのGAM培地中で、嫌気性グローブボックス(Electrotek)中で上記のように3回に分けて培養した。13時間の培養後、培養物を1,500gで5分間遠心分離した。細菌細胞を内部標準として100 µMのノルバリンを含む0.6 mlの冷(-40 ℃)50%水性メタノールに再懸濁し、ドライアイスに30分間突入させ、その後氷上で解凍した。0.4 mlのクロロホルムを加えて30秒間ボルテックスし、17,530g (4 ℃) で10分間遠心分離し、上清を新しい1.5 mlチューブに移し、FreeZone Freeze Dryers (Labconco) で-105 ℃で乾燥させた。GC-MS分析のために、代謝物を以下のように誘導体化した。まず、乾燥したペレットに70μlのピリジンを加え、80℃で20分間インキュベートした。冷却後、30 μl の N-tert-butyldimethylsilyl-N-methyltrifluoroacetamide (Sigma-Aldrich) を加え、80 ℃で60分間再インキュベートしてから17,530g (4 ℃) で10分間遠心分離を行った。上清をオートサンプラーバイアルに移し,GC/MS分析に供した。島津QP-2010 Ultra GC-MSシステムの注入温度を250 ℃にプログラムし、1 µlの試料を注入した。GCオーブン温度は110 °Cで4分間、3 °C min-1で230 °C、20 °C min-1で280 °Cに上昇し、この温度で2分間最終ホールドしました。ヘリウムキャリアガスを用いたGC流量は50 cm s-1でした。使用したGCカラムは、20 m × 0.25 mm × 0.25 mmのRxi-5 msです。GC-MSのインターフェース温度は300 ℃、イオン源温度は200 ℃、イオン化電圧は70 Vとした。質量分析計はm/zレンジ50-800をスキャンするように設定し、検出器は1 kVとした。GC-MSのデータは、同位体標識の決定のために分析された。13C ラベリングを決定するために、代謝物の既知のフラグメントの質量分布をマススペクトルから抽出した。各フラグメントについて、抽出されたデータは、最も軽い同位体(重い同位体を含まない、M0)の質量強度と、M0に対して単位質量が増加する同位体から構成されています。質量分布はすべての同位体の合計で割ることで正規化し、以前に記述されたように7×7行列ベースの確率的方法を用いてH、O、C元素の重同位体の自然存在量について補正し、MATLAB (release R2021a)で実装しました。ラベル化結果は、特定の前駆体からの同位体ラベルを含む特定の化合物の平均的な割合として表されます。
経口投与実験
4-8-110および糞便内容物から分離した大腸菌(4-15-1および4-8-110を含む)を、嫌気性グローブボックス(Electrotek)内で、上記と同様にGAM培地(日水製薬)でそれぞれ13時間および4時間培養した。GAM培地の添加により光学密度値を0.2に調整し、グリセロールを最終容量の1/6まで添加し、アリコートを-80℃で保存した。無菌マウス(Kunming line)は華中農業大学から提供された。マウスを用いたすべての実験手順は、華中農業大学の倫理委員会の承認を得た(HZAUMO-2021-0077)。雌マウス5匹ずつの2群(AおよびB)を2つの別々のケージに収容した(温度、25±2℃;湿度、45-60%;光周期、12時間-12時間明暗;明時間、06:30-18:30)。マウスに100μlのPBS(A群)または100μlのPBS+80g l-1 GalNAc(100μlあたり8mgまたは生体重の〜200mg kg-1に相当)(B群)を滅菌注射器で直接口に含んで10日間連続(2〜11日目)、09:00と16:00)ゲバリングさせた。さらに、全てのマウスに、4-8-110グリセロールストック(上記参照)150μlを1日1回(16:00に)5日間連続投与し、大腸菌グリセロールストック(上記参照)150μlを1日1回(16:00に)3日間連続投与(5日から7日目)した。最後の細菌接種から5日後(12日目、文献98に基づく)にマウスを安楽死させ、各マウスについて糞便を採取した。細菌DNAは、QIAamp fast DNA stool mini kit(Qiagen)を用いて抽出した。16S rRNA遺伝子のV3-V4領域を増幅し、上述の方法を用いて塩基配列を決定した。リードは、以前に決定した4-8-110株および大腸菌のV3-V4配列にマッピングした。平均99.74%のリードが4-8-110または大腸菌の参照配列のいずれかにマップされた。
大腸菌とOTU476様株のGalNAc添加に伴うGalNAcオペロンの誘導性とトランスクリプトーム応答のテスト
バクテリアの増殖
細菌は、10%の水素、10%の二酸化炭素、80%の窒素を含む嫌気性グローブボックス (Electrotek) で37 °Cで増殖させた。サンプル(4 ml)を穏やかに振盪した後ピペッティングし、紫外線分光光度計(Yoke Instrument)を用いて600 nmの光学密度(OD600)を測定した。実験は3連で行った。
RNA抽出
OTU476様2株(4-8-110、4-15-1)および大腸菌の培養菌体を指数増殖期終了時(それぞれ11時間、4時間)に回収した。TRIzol Reagent を用いて,製造者のマニュアルに従って細菌細胞から Total RNA を抽出し,DNase I (TaKara) を用いてゲノム DNA を除去した.2100 Bioanalyser (Agilent) と NanoDrop-2000 (Thermo Fisher Scientific) を用いて total RNA の量と質を評価した。OD260/280 = 1.8-2.0, OD260/230 ≥ 2.0, RIN ≥ 6.5, 28S:18S ≥ 1.0, ≥100 ng μl-1, ≥2 μgのRNAサンプルを用いて、RNA-seq用のライブラリーを構築した。
ライブラリーの構築とシークエンス
RNA-seq用ライブラリーは、2μgのトータルRNAを用いてTruSeq RNA sample preparation Kit(Illumina)に従い構築した。簡単に言うと、Ribo-Zero Magnetic kit(Epicenter)を用いて、total RNAからrRNAを除去した。すべてのmRNAは、断片化バッファーを加えることによって短い断片(200ヌクレオチド)に分解された。SuperScript double-stranded cDNA synthesis kit (Invitrogen) とRandom hexamer primers (Illumina) を用いて二本鎖cDNAを合成し、ライブラリ構築プロトコル (Illumina) に従って末端修復、リン酸化、A base付加の処理をした。構築したライブラリーは、NovaSeq 6000プラットフォームで2×150 bpペアエンド戦略で配列決定された。塩基コールと品質値の計算は、Illumina GA Pipeline (v.1.6) (Illumina)を用いて実施した。
バイオインフォマティクス解析
クリーンリードを得るために、低品質配列、5%以上のN塩基(不明塩基)を含むリード、アダプター配列を含むリードを生データからPerlスクリプトで除去した。クリーンな配列は、Bowtie2 (v.2.4.2) を用いて、2つのOTU476様株(上述のように我々によって生成)と大腸菌(GenBank: NC_000913.3)の参照ゲノム配列にマッピングした99。参照ゲノムにマッピングされたリードカウントは、featureCounts (v.1.6.4) を用いて各サンプルについて定量された。遺伝子発現量の算出には、マッピングされた100万リードあたりのexon modelのfragments per kilobaseメソッドを使用しました。R (v.g3.5.3) の DESeq2 パッケージ100 を用いて、発現量の差の検定を行った。
ABO遺伝子型がヒトのErysipelotrichaceaeの存在量に及ぼす影響の解析
サンプル
大腸癌の全国スクリーニングキャンペーンの一環として、リエージュ大学の大学病院(CHU)を訪れたヨーロッパ系の健康な300人を含む、既報の CEDAR コホート101 のデータを使用した。血液サンプルと腸管生検(回腸、結腸、直腸)は、完全な同意のもとに採取された。実験プロトコルは、リエージュ大学付属病院の倫理委員会により承認された。ヒトを対象とした実験に関するヘルシンキ宣言の勧告に基づき、提供前にインフォームド・コンセントを取得した。
塩基配列の決定
微生物相解析のため、QIAamp DNA Stool Mini Kit (QIAgen)を用いて生検からDNAを抽出した。V1-V2、V3-V4、V5-V6可変領域に対応する3つの16S rRNAアンプリコンを別々のPCR反応で生成し、GIGAゲノミクス中核施設の標準プロトコルに従ってMiSeq装置(イルミナ)でペアエンド(2×300 bp)NGS配列決定用に処理した。
データ処理
リードは3′末端からQV20トリミングし、デマルチプレックスし、bbdukツール(バージョン38.82)102を用いてプライマー配列を除去した。ヒトゲノムにマッピングされたリードはBBTools suite (v.38.82)を用いて除去された。対応するパイプラインはSnakemake (v.7.0.1) を用いて構築しました103。さらなる解析はQIIME 2 (v.2018.11)104を使用して実施した。ペアエンドリードをDADA2プラグイン(v.1.16)105を用いてノイズ除去し、バッチ固有のトリミング長パラメータを用いて結合したところ、V1-V2については1ランあたり9.1±2.0 kbのアンプリコン配列バリアント(ASV)、V3-V4については4.5 ±1.6 kb、V5-V6アンプリコンについては6.8 ±0.67 kbが得られました。既知の汚染分類群にマッピングされた ASV、および存在量がカバー深度と負の相関を持つ ASV は除去された。20%以上の汚染ASVを含むサンプルは、さらなる解析から除外されました。ASVはDNACLUSTプログラム(v.r3)106を用いて97%同一性レベルのOTUにクラスタリングされた。OTU割り当て後、リード数は10,000(V1-V2、V5-V6)、5,000(V3-V4)に希釈した。腸内位置はOTU存在量の分散のごく一部を探索したに過ぎないため(L.S. et al. 検出されたASVとブタのマイクロバイオーム由来のOTU476およびOTU327とのローカルアラインメントの同一性は、blastn107を用いて測定された。
ABO血液型との関連性解析
ABO血液型が個々のOTUの標準化存在量に及ぼす影響については、(1) ABO血液型(A、B、AB、O)、(2) セクレタリアンの有無、(3) 性、(4) 喫煙状況、(5) 年齢、(6) ボディマス指数を含む線形モデル(lm R関数)を用いて行った。解析は、異なるアンプリコンについて別々に行われた。
報告書の概要
研究デザインに関する詳細な情報は、本論文にリンクされているNature Research Reporting Summaryに掲載されています。
データの入手方法
16S rRNAシーケンスデータ、メタゲノム配列データ、RNA-seqデータはすべて、アクセッション番号CRA006230、CRA006239、CRA006240、CRA006216でGSAデータベースに提出されました。遺伝子型データはGVM(http://bigd.big.ac.cn/gvm/getProjectDetail?project=GVM000310)にアクセッション番号GVM000310でGSAデータベースに寄託された。GWASの要約統計はFigshare (https://doi.org/10.6084/m9.figshare.19313960)で公開されています。実験用ブタの全ゲノム配列データは、GSAデータベース(https://ngdc.cncb.ac.cn/gsa/browse/CRA006383)にアクセッション番号CRA006383で寄託されている。ソースデータはGitHub (https://github.com/yanghuijxau/Manuscript-microbiota-ABO)で公開されている。
コードの公開
本研究成果を再現するためのコードとソースデータは、GitHub (https://github.com/yanghuijxau/Manuscript-microbiota-ABO) で公開されています。
参考文献
Kundu, P., Blacher, E., Elinav, E. & Pettersson, S. Our gut microbiome: the evolving inner self(私たちの腸内細菌:進化する自己). Cell 171, 1481-1493 (2017)に掲載されています。
論文
キャス
PubMed
グーグルスカラー
Rothschild, D. et al. Environment dominates over host genetics in shaping human gut microbiota(ヒト腸内細菌叢の形成において、環境が宿主の遺伝学よりも優勢である。ネイチャー 555, 210-215 (2018).
論文
ADS
キャス
PubMed
グーグルスカラー
O'Hara, E., Neves, A. L. A., Song, Y. & Guan, L. L. 牛の生産と健康における腸内細菌群の役割:ドライバーかパッセンジャーか?Annu. Rev. Anim. Biosci. 8, 199-220 (2020).
論文
PubMed
Google Scholar
Schmidt, T. S. B., Raes, J. & Bork, P. The human gut microbiome: from association to modulation.(ヒト腸内細菌群:関連性から調節まで)。セル 172, 1198-1215 (2018).
論文
キャス
PubMed
グーグルスカラー
Polderman, T. J. C. et al. 50年にわたる双子研究に基づくヒト形質の遺伝率のメタアナリシス. Nat. Genet. 47, 702-709 (2015).
論文
CAS
PubMed
グーグルスカラー
Polubriaginof, F. C. G. et al. 医療記録で報告された家族関係から推測される疾患遺伝率. セル 173, 1692-1704 (2018).
論文
キャス
PubMed
パブメッドセントラル
Google Scholar
Benson, A. K. et al. 腸内細菌叢組成の個人差は、複数の環境因子と宿主遺伝因子によって形成される複雑な多遺伝子形質である。Proc. Natl Acad. Sci. USA 107, 18933-18938 (2010).
論文
ADS
CAS
PubMed
PubMed Central
Google Scholar
Yatsunenko, T. et al. 年齢や地理的条件から見たヒトの腸内細菌叢。Nature 486, 222-227 (2012).
論文
ADS
CAS
PubMed
PubMed Central
Google Scholar
Goodrich, J. K. et al. Human genetics shape the gut microbiome. Cell 159, 789-799 (2014).
論文
CAS
パブメド
PubMed Central
Google Scholar
Blekhman, R. et al. Host genetic variation impacts microbiome compoistion across human body sites.(宿主の遺伝子変異は、ヒトの身体部位間のマイクロバイオーム構成に影響を与える。Genome Biol. 16, 191 (2015).
論文
PubMed
パブメドセントラル
キャス
Google Scholar
Turpin, W. et al. 健康な大規模コホートにおける宿主ゲノムと腸内細菌組成の関連性。Nat. Genet. 48, 1413-1417 (2016).
論文紹介
キャス
PubMed
グーグルスカラー
Bonder, M. J. et al. 宿主遺伝学が腸内細菌に及ぼす影響。Nat. Genet. 48, 1407-1412 (2016).
論文
CAS
PubMed
グーグルスカラー
Wang, J. et al. Genome-wide association analysis identifies variation in vitamin D receptor and other host factors influencing the gut microbiota.(ゲノムワイド関連解析によるビタミンD受容体および腸内細菌叢に影響を及ぼす他の宿主因子の変異の特定)。Nat. Genet. 48, 1396-1406 (2016).
論文
キャス
PubMed
PubMed Central
Google Scholar
Hughes, D. A. et al. Genome-wide associations of human gut microbiome variation and implications for causal inference analyses.ヒューズ、D.A.らによるヒト腸内細菌のゲノムレベルでの変異の関連性と因果関係解析の意味。Nat. Microbiol. 5, 1079-1087 (2020).
論文
CAS
パブメド
PubMed Central
Google Scholar
Sankararaman, S. et al. 現生人類におけるネアンデルタール人の祖先のゲノムランドスケープ. Nature 507, 354-357 (2014).
論文紹介
ADS
CAS
PubMed
PubMed Central
Google Scholar
Patterson, N. et al. Genetic evidence for complex speciation of humans and chimpanzees. Nature 441, 1103-1108 (2006).
論文
ADS
CAS
PubMed
Google Scholar
Donaldson, G. P., Lee, S. M. & Mazmanian, S. K. Gut biogeography of the bacterial microbiota(腸内細菌叢の生物地理学). Nat. Rev. Microbiol. 14, 20-32 (2016).
論文
CAS
PubMed
Google Scholar
Radjabzadeh, D. et al. 子供と成人の腸内細菌叢の多様性、組成、機能的な違い。Sci. Rep. 10, 1040 (2020).
論文
ADS
CAS
PubMed
PubMed Central
Google Scholar
Goodrich, J. K. et al. 英国双子における腸内細菌叢の遺伝的決定因子. Cell Host Microbe 19, 731-743 (2016).
論文紹介
キャス
PubMed
PubMed Central
Google Scholar
感染症と宿主の感受性における血液型。臨床。Microbiol. Rev. 28, 801-870 (2015).
論文紹介
CAS
PubMed
PubMed Central
Google Scholar
Rühlemann, M. C. et al. 8,956人のドイツ人におけるゲノムワイド関連研究により、ABO組織-血液型が腸内細菌に及ぼす影響が明らかにされた。Nat. Genet. 53, 147-155 (2021).
論文
PubMed
CAS
Google Scholar
Lopera-Maya, E. E. et al. オランダ・マイクロバイオーム・プロジェクト参加者7,738名における腸内マイクロバイオームに対する宿主遺伝の影響。Nat. Genet. 54, 143-151 (2022).
論文
CAS
パブコメ
Google Scholar
Qin, Y. et al. 単一集団コホートにおけるヒト腸内細菌叢と発症疾患に対する宿主遺伝学と食事の複合的影響。Nat. Genet. 54, 134-142 (2022).
論文
CAS
パブコメ
Google Scholar
Choi, M. K. et al. ブタにおけるヒトABO血液型オルソログ遺伝子の完全配列情報の決定と血液型頻度の品種差. Gene 640, 1-5 (2018).
論文
CAS
PubMed
グーグルスカラー
Wang, S.ら、グリコシルトランスフェラーゼ阻害剤の設計:ピロリン酸の代用品としてのセリン類似体?ChemPlusChem 80, 1525-1532 (2015).
論文
CAS
PubMed
グーグルスカラー
Ségurel, L. et al. ABO血液型は霊長類における種を超えたポイリモルフィズムである. Proc. Natl Acad. Sci. USA 109, 18493-18498 (2012).
論文
ADS
PubMed
PubMed Central
Google Scholar
豚のゲノム配列決定の10年:豚の家畜化と進化に関する風説。Genet. Sel. Evol. 48, 23-32 (2016).
論文
PubMed
PubMed Central
キャス
Google Scholar
Ravcheev, D. A. & Thiele, I. ヒト腸内細菌群の比較ゲノム解析から、宿主が合成したムチン糖鎖の分解とムチン由来の単糖の利用に関わる代謝経路が広く分布していることが明らかになった。Front. Genet. 8, 111 (2017).
論文
PubMed
PubMed Central
キャス
Google Scholar
Tailford, L. A. et al. ヒト腸内細菌群におけるムチン糖鎖のフォージング。Front. Genet. 6, 81 (2015).
論文
PubMed
PubMed Central
キャス
Google Scholar
Lien, K. A., Sauer, W. C. & He, J. M. Dietary influences on the secretion into and degradation of mucin in the digestive tract of monogastric animals and humans.(単胃動物とヒトの消化管におけるムチンの分泌と分解に対する食事の影響). J. Anim. Feed Sci. 10, 223-245 (2001).
論文
Google Scholar
大腸菌におけるN-アセチルガラクトサミンおよびガラクトサミンの利用経路。Mol. Microbiol. 37, 125-135 (2000).
論文
PubMed
グーグルスカラー
Rodionov, D. A. et al. Shewanella属の糖利用経路のゲノム百科事典. BMC Genom. 11, 494 (2010).
論文
CAS
Google Scholar
プロテオバクテリアのN-アセチルガラクトサミン利用経路とレギュロン。J. Biol. Chem. 287, 28047-28056 (2012).
論文
CAS
パブメド
PubMed Central
Google Scholar
Hu, Z., Patel, I. R. & Mukherjee, A. Escherichia coli strain O157:H7 and CにおけるN-アセチル-D-ガラクトサミンおよびD-ガラクトサミン異化経路のagaA、agaI、agaS遺伝子の役割に関する遺伝子解析 BMC Microbiol. 13, 94 (2013).
論文
CAS
PubMed
PubMed Central
Google Scholar
Bidart, G. N., Rodriguez-Diaz, J., Monedoro, V. & Yebra, M. J. Lactobacillus caseiの粘膜およびヒト乳関連糖鎖ガラクト-N-ビオースおよびラクト-N-ビオースを利用する独自の遺伝子クラスター. Mol. Microbiol. 93, 521-538 (2014).
論文
CAS
PubMed
Google Scholar
Zhang, H. et al. N-アセチル-ガラクトサミン利用経路の2つの新規制御因子と細菌感染における異なる役割。Microbiol. Open 4, 983-1000 (2015).
論文
CAS
Google Scholar
Lawrence, J. Selfish operons: the evolutionary impact of gene clustering in prokrayotes and eukaryotes. Curr. Opin. Genet. Dev. 9, 642-648 (1999).
論文
CAS
パブコメ
Google Scholar
クーニン、E.V. ゲノムアーキテクチャの進化. Int. J. Biochem. セルバイオロジー 41, 298-306 (2009).
論文
CAS
パブコメ
Google Scholar
Lombard, V. et al. 2013年の糖質活性酵素データベース(CAZy)。Nucleic Acids Res. 42, D490-D495 (2014)に掲載されています。
論文
CAS
PubMed
Google Scholar
Rahfeld, P. et al. A型血液をユニバーサルO型に変換するヒト腸内細菌群の酵素経路. Nat. Microbiol. 4, 1475-1585 (2019).
論文
キャス
PubMed
グーグルスカラー
Rahfled, P. et al. Prospecting for microbial α-N-acetylgalactosaminidases yields a new class of GH31 O-glycanase. J. Biol. Chem. 294, 16400-16415.
陳佑他:ABO式血液型と重症急性呼吸器症候群の感受性. JAMA 293, 1450-1451 (2005).
Google Scholar
Ellinghaus, D. et al. ABO血液型遺伝子座と第3染色体遺伝子クラスターは、イタリアとスペインのゲノムワイド関連解析において、SARS-CoV-2呼吸不全と関連することがわかった。Preprint at medRxiv https://doi.org/10.1101/2020.05.31.20114991 (2020).
Blancher, A. Evolution of the ABO supergene family(ABOスーパー遺伝子ファミリーの進化)。ISBT Sci. Ser. 8, 201-206 (2013).
論文
CAS
Google Scholar
Makivuokko, H. et al. ABO血液型とヒト腸内細菌叢の構成との関連性. BMC Microbiol. 12, 94 (2012).
論文
PubMed
PubMed Central
Google Scholar
Davenport, E. R. et al. ABO抗原と分泌物の状態は、1,500人の双子における腸内細菌叢の構成と関連がない。BMC Genom. 17, 941-955 (2016).
論文
グーグルスカラー
Kurilshikov, A. et al. Large-scale association analyses identify host factors influencing human gut microbiome composition. Nat. Genet. 53, 156-165 (2021).
論文
CAS
パブメド
PubMed Central
Google Scholar
Malmuthuge, N., Griebel, P. J. & Guan, L. L. 離乳前の子牛の消化管内の粘膜および消化物に関連する常在菌の分類学的同定を行った。Appl. Environ. Microbiol. 80, 2021-2028 (2014).
論文
ADS
PubMed
PubMed Central
キャス
Google Scholar
Hanson, M. E. B. et al. タンザニアおよびボツワナ農村部の多様なコホートにおけるヒト腸内細菌の集団構造. Genome Biol. 20, 16 (2019).
論文
Google Scholar
Warr, A. et al. 豚の遺伝学とゲノミクス研究を可能にする改良型豚参照ゲノム配列. ギガサイエンス 9 (2019).
Li, H. & Durbin, R. Burrows-Wheeler 変換による高速かつ正確なロングリードのアライメント。バイオインフォマティクス 26, 589-595 (2010).
論文
PubMed
PubMed Central
CAS
Google Scholar
Li, H. et al. Sequence Alignment/Map フォーマットと SAMtools. バイオインフォマティクス 25, 2078-2079 (2009).
論文
PubMed
PubMed Central
CAS
Google Scholar
Rimmer, A. et al. マッピング、アセンブリ、ハプロタイプに基づくアプローチを統合し、臨床シーケンシングアプリケーションでバリアントをコールする。Nat. Genet. 46, 912-918 (2014).
論文
CAS
PubMed
PubMed Central
Google Scholar
Chang, C. C. et al. 第二世代PLINK: rising to the challenge of larger and richer datasets.(第二世代PLINK:より大きくリッチなデータセットへの挑戦)。Gigascience 4, 7 (2015).
論文
PubMed
パブメドセントラル
キャス
Google Scholar
Browning, S. R. & Browning, B. L. 局所的なハプロタイプクラスタリングを用いた全ゲノム関連研究のための迅速かつ正確なハプロタイプ位相決定と欠損データ推論。Am. J. Hum. Genet. 81, 1084-1097 (2007).
論文
CAS
パブメド
PubMed Central
Google Scholar
Coppieters, W., Karim, L. & Georges, M. SNP-based quantitative deconvolution of biological mixtures: application to the detection of cow with subclinical mastitis by whole genome sequencing of tank milk.「SNPに基づく生体混合物の定量的デコンボリューション:タンク乳の全ゲノムシーケンスによる不顕性乳腺炎の牛の検出への応用」。Genome Res. 30, 1201-1207 (2020).
論文
CAS
PubMed
PubMed Central
Google Scholar
Bolger, A. M., Lohse, M. & Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data(イルミナ配列データのための柔軟なトリマー). バイオインフォマティクス 30, 2114-2120 (2014).
論文
CAS
PubMed
PubMed Central
Google Scholar
FLASH: Fast Length Adjustment of Short Reads to improve Genome assemblies. バイオインフォマティクス 27, 2957-2963 (2011).
論文
PubMed
PubMed Central
CAS
Google Scholar
Edgar, R. C. BLASTより数段速い検索とクラスタリング。バイオインフォマティクス 26, 2460-2461 (2010).
論文
CAS
パブコメ
Google Scholar
Rognes, T., Flouri, T., Nichols, B., Quince, C. & Mahe, F. VSEARCH: a versatile open source tool for metagenomics.(VSEARCH:メタゲノム解析のための多機能オープンソースツール)。PeerJ 4, e2584 (2016).
掲載記事
PubMed
PubMed Central
Google Scholar
Wang, Q., Garrity, G. M., Tiedje, J. M. & Cole, J. R. Naive Bayesian classifier for rapid assignment of rRNA sequences into the new bacterial taxonomy(新しい細菌分類法へのrRNA配列の迅速な割り当てのためのナイーブベイズ型分類法)。Appl. Environ. Microbiol. 73, 5261-5267 (2007).
論文
ADS
CAS
PubMed
PubMed Central
Google Scholar
Schloss, P. D. et al. Introducing mothur: オープンソース、プラットフォーム非依存、コミュニティ支援型、微生物コミュニティの記述および比較のためのソフトウェア。Appl. Environ. Microbiol. 75, 7537-7541 (2009).
論文
ADS
CAS
PubMed
PubMed Central
Google Scholar
Cheema, M. U. & Pluznick, J. L. Gut microbiota plays a central role to modulate the plasma and fecal metabolomes in response to angiotensin II.腸内細菌叢はアンジオテンシンIIに反応する血漿および糞便のメタボロームを調節する中心的な役割を果たす。Hypertension 74, 184-193 (2019).
論文
キャス
PubMed
グーグルスカラー
Zhou, X. & Stephens, M. Genome-wide efficient mixed-model analysis for association studies. Nat. Genet. 44, 821-824 (2012).
論文
CAS
パブメド
PubMed Central
Google Scholar
GCTA:ゲノムワイド複合形質解析のためのツール。Am. J. Hum. Genet. 88, 76-82 (2011).
論文
CAS
パブメド
PubMed Central
Google Scholar
Dixon, P. VEGAN, a package of R functions for community ecology (コミュニティ生態学のためのR関数パッケージ). J. Veg. Sci. 14, 927-930 (2003).
論文
Google Scholar
Visscher, P. M. et al. Genome-wide identity-by-descent sharing between full siblings から遺伝率の無前提推定。PLoS Genet. 2, e41 (2006).
論文
PubMed
パブメドセントラル
CAS
Google Scholar
Ziyatdinov, A. et al. lme4QTL: 関連個体の遺伝学的研究のための柔軟な共分散構造を持つ線形混合モデル. BMC Bioinform. 19, 68 (2018).
論文
Google Scholar
Haseman, J. K. & Elston, R. C. The investigation of linkage between a quantitative trait and a marker locus(量的形質とマーカー遺伝子座の連鎖の調査). Behav. Genet. 2, 3-19 (1972).
論文
CAS
パブコメ
Google Scholar
Aulchenko, Y. S., Ripke, S., Isaacs, A. & van Duijn, C. M. GenABEL: an R library for genome-wide association analysis(ゲノムワイド関連解析のためのRライブラリー). バイオインフォマティクス 23, 1294-1296 (2007).
論文
CAS
PubMed
Google Scholar
METAL: Genomewide Association Scans の高速かつ効率的なメタ解析。バイオインフォマティクス 26, 2190-2191 (2010).
論文
CAS
パブメド
PubMed Central
Google Scholar
Kolmogorov, M., Yuan, J., Lin, Y. & Pevzner, P. A. リピートグラフを用いた長くてエラーが起こりやすいリードのアセンブル。Nat. Biotechnol. 37, 540-546 (2019).
論文
キャス
PubMed
グーグル・スカラー
Vaser, R., Sovic, I., Nagarajan, N. & Sikic, M. Fast and accurate de novo genome assembly from long uncorrected reads.(長い補正なしリードからの高速で正確なデノボゲノムアセンブリ)。Genome Res. 27, 737-746 (2017)に掲載されています。
論文
CAS
PubMed
PubMed Central
Google Scholar
Li, H. Aligning sequence reads, clone sequences and assembly contigs with BWA-MEM. Preprint at arXiv https://arxiv.org/abs/1303.3997 (2013).
Walker, B. J. et al. Pilon: an integrated tool for comprehensive microbial variant detection and genome assembly improvement(Pilon:包括的な微生物バリアント検出とゲノムアセンブリ改善のための統合ツール)。PLoS ONE 9, e112963 (2014)。
論文
ADS
PubMed
パブメッドセントラル
キャス
Google Scholar
Harris, R. S. Improved Pairwise Alignment of Genomic DNA(ゲノムDNAのペアワイズアライメントの改善)。博士論文、ペンシルバニア州立大学(2007)。
Li, H. Minimap2: Pairwise Alignment for nucleotide sequences. バイオインフォマティクス 34, 3094-3100 (2018).
論文紹介
キャス
PubMed
パブメッドセントラル
Google Scholar
Dobin, A. et al. STAR: 超高速ユニバーサルRNA-seqアライナー. バイオインフォマティクス 29, 15-21 (2013).
論文
CAS
PubMed
Google Scholar
Liao, Y., Smyth, G. K. & Shi, W. FeatureCounts: an efficient general purpose program for assigning sequence reads to genomic features(FeatureCounts:配列リードをゲノムフィーチャーに割り当てるための効率的な汎用プログラム). バイオインフォマティクス 30, 923-930 (2014).
論文
CAS
PubMed
グーグルスカラー
Ai, H. et al. Adaptation and possible ancient interspecies introgression in pigs identified by whole-genome sequencing.ブタの適応と古代の種間導入の可能性。Nat. Genet. 47, 217-225 (2015).
論文
CAS
PubMed
グーグルスカラー
Van der Auwera, G. A. et al. FastQデータから高信頼バリアントコールまで:ゲノム解析ツールキットのベストプラクティス・パイプライン. Curr. Protoc. Bioinform. 43, 11.10.11-11.10.33 (2013).
論文
Google Scholar
DePristo, M. A. et al. A framework for variation discovery and genotyping using next-generation DNA sequencing data(次世代DNAシーケンスデータを用いた変異の発見とジェノタイピングのためのフレームワーク)。Nat. Genet. 43, 491-498 (2011).
論文
CAS
パブメド
PubMed Central
Google Scholar
Weir, B. S. & Cockerham, C. C. 集団構造解析のためのF統計量の推定. Evolution 38, 1358-1370 (1984).
CAS
PubMed
Google Scholar
F統計量と細分化された集団における遺伝子多様性の解析. Ann. Hum. Genet. 41, 225-233 (1977).
論文
CAS
パブコメ
MATH
Google Scholar
HISAT2およびHISAT-genotypeを用いたグラフベースのゲノムアライメントおよびジェノタイピング。Nat. Biotechnol. 37, 907-915 (2019).
論文
キャス
PubMed
PubMed Central
Google Scholar
Hunt, M. et al. Circlator: Long sequencing readsを用いたゲノムアセンブリの自動環状化。Genome Biol. 16, 294 (2015).
論文
PubMed
PubMed Central
キャス
Google Scholar
Hyatt, D. et al. Prodigal: 原核生物の遺伝子認識と翻訳開始位置の同定. BMC Bioinform. 11, 119 (2010).
論文
CAS
Google Scholar
Chen, S., Zhou, Y., Chen, Y. & Jia, G. fastp: an ultra-fast all-in-one FASTQ preprocessor. バイオインフォマティクス 34, i884-i890 (2018).
論文
PubMed
PubMed Central
キャス
Google Scholar
Li, D. et al. MEGAHIT v1.0: a fast and scalable metagenome assembler driven by advanced methodologies and community practices.(メガヒットv1.0:先進的な方法論とコミュニティの実践によって駆動する高速でスケーラブルなメタゲノム・アセンブラ)。Methods 102, 3-11 (2016).
論文
CAS
PubMed
グーグルスカラー
Uritskiy, G. V., DiRuggiero, J. & Taylor, J. MetaWRAP-a flexible pipeline for genome-resolved metagenomic data analysis. マイクロバイオーム 6, 158 (2018).
論文
PubMed
PubMed Central
Google Scholar
Parks, D. H., Imelfort, M., Skennerton, C. T., Hugenholtz, P. & Tyson, G. W. CheckM: assess the quality of microbial genomes recovered from isolates, single cells, and metagenomes. Genome Res. 25, 1043-1055 (2015).
論文
CAS
PubMed
PubMed Central
Google Scholar
Olm, M. R., Brown, C. T., Brooks, B. & Banfield, J. F. dRep: a tool for fast and accurate genomic comparisons that enables improved genome recovery from metagenomes through de-replication. ISME J. 11, 2864-2868 (2017)に掲載されています。
論文紹介
キャス
PubMed
PubMed Central
Google Scholar
BlastKOALAとGhostKOALA:ゲノムおよびメタゲノム配列の機能解析のためのKEGGツール. J. Mol. Biol. 428, 726-731 (2016)に掲載されました。
論文紹介
CAS
PubMed
グーグルスカラー
Segata, N., Bornigen, D., Morgan, X. C. & Huttenhower, C. PhyloPhlAnは、微生物の系統分類と分類学的配置を改善する新しい方法である。Nat. Commun. 4, 2304 (2013).
論文
ADS
PubMed
キャス
Google Scholar
Li, M. et al. アルドラーゼBは、G6PDおよびペントースリン酸経路を阻害することにより、肝細胞癌の発生を抑制する。Nat. Cancer 1, 737-747 (2020)に掲載されています。
Google Scholar
Nanchen, A., Fuhrer, T. & Sauer, U. 13C実験とガスクロマトグラフ質量分析データからの代謝フラックスラティオの決定:プロトコルと原理。メソッド Mol. Biol. 358, 177-197 (2007).
論文
CAS
PubMed
Google Scholar
van Winden, W. A. et al. 天然由来の同位体に対する質量アイソトープ分布の補正。Biotechnol. バイオエンジニアリング。80, 477-479 (2002).
論文
PubMed
CAS
Google Scholar
Staley et al. 抗生物質による条件付け後、単回経口投与によるマウスへのヒト微生物叢の安定的な生着。Microbiome 5, 87 (2017).
論文
PubMed
PubMed Central
Google Scholar
Langmead, B. & Salzberg, S. L. Fast gapped-read alignment with Bowtie 2(ボウタイ2によるギャップリードの高速アライメント)。Nat. Methods 9, 357-359 (2012).
論文
CAS
パブメド
PubMed Central
Google Scholar
Love, M. I., Huber, W. & Anders, S. DESeq2によるRNA-seqデータのフォールドチェンジと分散のモデレートされた見積もり。Genome Biol. 15, 550 (2014).
論文
PubMed
PubMed Central
CAS
Google Scholar
IBDのリスク遺伝子座は、原因遺伝子と考えられるものを含む多因子制御モジュールに富んでいる。Nat. Commun. 9, 2427 (2018).
論文
ADS
PubMed
パブメド・セントラル
キャス
Google Scholar
Bushnell, B. BBMap: A Fast, Accurate, Splice-Aware Aligner (version 38.82) https://sourceforge.net/projects/bbmap/ (2014).
Köster, J. & Rahmann, S. Snakemake: a scalable bioinformatics workflow engine(スネークメイク:スケーラブルなバイオインフォマティクスワークフローエンジン). バイオインフォマティクス 28, 2520-2522 (2012).
論文
PubMed
CAS
Google Scholar
Bolyen, E., Rideout, J. R., Dillon, M. R., Bokulich, N. A. & Caporaso, J. G. Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2.Nat. Biotechnol. 37, 852-857 (2019).
論文
キャス
PubMed
PubMed Central
Google Scholar
Callahan, B. J. et al. DADA2: Illuminaアンプリコンデータからの高解像度サンプル推論。Nat. Methods 13, 581-583 (2016)に掲載されています。
論文
CAS
PubMed
PubMed Central
Google Scholar
Ghodsi, M., Liu, B. & Pop, M. DNACLUST: 正確で効率的な系統樹マーカー遺伝子のクラスタリング. BMC Bioinform. 12, 271 (2011).
論文
Google Scholar
J. Mol. Biol. 215, 403-410 (1990)に掲載されています。
論文
CAS
PubMed
Google Scholar
Srivastava, A. et al. Genomes of the mouse collaborative cross. Genetics 206, 537-556 (2017).
論文
キャス
PubMed
PubMed Central
Google Scholar
Yu, N. et al. 1番染色体上の10kb領域におけるヒトDNA配列変異のグローバルパターン。Mol. Biol. Evol. 18, 214-222 (2001).
論文
CAS
パブコメ
Google Scholar
1000ゲノムプロジェクトコンソーシアム。集団規模の配列決定から得られたヒトゲノムの変異マップ。Nature 467, 1061-1073 (2010).
論文
パブコメ・セントラル
CAS
Google Scholar
Frantz, L. A. F. et al. Eurasian wild and domestic pig genomesの解析から得られた家畜化過程における長期的な遺伝子フローと淘汰の証拠. Nat. Genet. 47, 1141-1148 (2015).
論文
CAS
PubMed
Google Scholar
Charlier, C. et al. NGS-based reverse genetic screen for common embryonic lethal mutations compromising fertility in livestock.(家畜の繁殖力を損なう一般的な胚致死突然変異のためのNGSベースの逆遺伝子スクリーニング)。Genome Res. 26, 1333-1341 (2016).
論文
CAS
PubMed
PubMed Central
Google Scholar
Georges, M., Charlier, C. & Hayes, B. 家畜の改良のためのゲノム情報の利用。Nat. Rev. Genet. 20, 135-156 (2019).
論文
キャス
PubMed
グーグルスカラー
Geraldes, A. et al. 常染色体、X連鎖、Y連鎖、ミトコンドリア遺伝子からハツカネズミの種分化の歴史を推測する. Mol. Ecol. 17, 5349-5363 (2008).
論文
PubMed
PubMed Central
Google Scholar
Huang, H. et al. 炎症性腸疾患遺伝子座を単一変量分解能でファインマッピング。ネイチャー 547, 173-178 (2017).
掲載記事
ADS
キャス
PubMed
PubMed Central
Google Scholar
Suzuki, T. A. & Nachman, M. W. Spatial heterogeneity of gut microbioal composition along the gastrointestinal tract in natural populatiions of house mice.(ハツカネズミの自然集団における消化管に沿った腸内細菌組成の空間的不均質性)。PLoS ONE 11, e0163720 (2016).
論文
PubMed
パブメドセントラル
キャス
Google Scholar
Vuik, F. E. R. et al. ヒト個体の全消化管に沿った粘膜関連微生物叢の構成. ueg j. 7, 897-907 (2019).
論文
キャス
Google Scholar
Rowe, J. A. et al. Blood group Oは、ロゼット減少のメカニズムを通じて、重症マラリア原虫から保護する。Proc. Natl Acad. Sci. USA 104, 17471-17476 (2007).
論文
ADS
CAS
PubMed
PubMed Central
Google Scholar
Robinson, M. G., Tolchin, D. & Halpern, C. Enteric bacterial agents and the ABO blood groups(腸内細菌とABO血液型). Am. J. Hum. Genet. 23, 135-145 (1971).
CAS
PubMed
PubMed Central
Google Scholar
Camus, D., Bina, J. C., Carlier, Y. & Santoro, F. ABO血液型とschistosomiasis mansoniの臨床型. Trans. R. Soc. Trop. Med. Hyg. 71, 182 (1977).
論文
CAS
PubMed
Google Scholar
Pereira, F. E. L., Bortolini, E. R., Carneiro, J. L. A., da Silva, C. R. M. & Neves, R. C. A, B, O血液型とschistosomias mansoni(Symmerの線維症)の肝脾臓型について. Trans. R. Soc. Trop. Med. Hyg. 73, 238 (1977).
論文
Google Scholar
Ndamba, J., Gomo, E., Nyazema, N., Makaza, N. & Kaondera, K. C. Schistosomiasis infection in relation to the ABO blood groups among school children in Zimbabwe. Acta Trop. 65, 181-190 (1997).
論文
CAS
PubMed
Google Scholar
Chaudhuri, A. & De, S. Cholera and blood groups. Lancet 2, 404 (1977).
論文
CAS
PubMed
Google Scholar
Boren, T. et al. 血液型抗原を介したHelicobacter pyloriのヒト胃上皮への吸着。Science 262, 1892-1895 (1993).
論文
ADS
CAS
PubMed
Google Scholar
Lindesmith, L. et al. ヒトのノーウォークウイルス感染に対する感受性と抵抗性。Nat. Med. 9, 548-553 (2003).
論文
CAS
パブコメ
Google Scholar
Galili, U. in α-Gal and Anti-Gal (eds Galili, U. & Avila, J. L.) Vol. 32, 1-23 (Springer, 1999).
このような場合、「医療と農業のための遺伝子組換えブタ」(Prather, R. S., Shen, M. & Dai, Y. Biotechnol. Genetic Eng. Rev. 25, 245-266 (2008).
CAS
Google Scholar
参考文献のダウンロード
謝辞
Y. He, S. Xiao, W. Li, Y. Guo and Y. Xingには実験用モザイクブタ集団の構築にご協力いただき、Y. SuとJ. Liには試薬の準備と試料の管理をお願いし、Y. Momozawa, R. Mariman, M. Mni, L. Karim and M. DekersにはCEDAR-1の16S rRNAデータ作成にご協力いただき、Jiangxi Department for Education, the Ministry of Science and Technology of P.R., the Ministry of P.R.C.のスタッフには、謝辞とさせていただきます。Jiangxi Department for Education, Ministry of Science Technology of P. R. China, Ministry of Agriculture and Rural Affairs, and Jiangxi department of Science and Technologyのスタッフには豚の異種株プロジェクトを長期にわたってサポートしてもらい、MIQUANTコンソーシアムのメンバーにはコメントとディスカッションをお願いした。L.H. は中国国家自然科学基金(31790410)および国家養豚産業技術体系(CARS-35)の支援を受けている。C. Chen は中国国家自然科学基金(31772579)、H.Y. はNational Postdoctoral Program for Innovative Talent (no. BX201700102); L.S. はFNRS IBD-GI-Seq project; M.G. は Chinese Thousand Talents Program, the Belgian EOS 'Miquant' project and the FNRS (CDR 'GEM' project)によるものです。C. Charlierは、FNRSのシニアリサーチアソシエイトである。
著者情報
著者ノート
これらの著者は等しく貢献した。Hui Yang, Jinyuan Wu
これらの著者はこの仕事を共同で監督した。Michel Georges、Congying Chen、Lusheng Huang
著者および所属
中国科学技術部豚の遺伝子改良と生産技術国家重点実験室、江西農業大学、南昌、中華人民共和国
Hui Yang, Jinyuan Wu, Xiaochang Huang, Yunyan Zhou, Yifeng Zhang, Min Liu, Qin Liu, Shanlin Ke, Maozhang He, Hao Fu, Shaoming Fang, Xinwei Xiong, Hui Jiang, Zhe Chen.呉忠子、Huang, Xiaochang Hu、Zhe Chen, Zhongzi Wu, Huanfa Gong, Xinkai Tong, Yizhong Huang, Junwu Ma, Jun Gao, Carole Charlier, Zhiyan Zhang, Huashui Ai, Bin Yang, Michel Georges, Congying Chen & Lusheng Huang.
リエージュ大学獣医学部・GIGA研究所アニマルゲノミクスユニット
Carole Charlier, Wouter Coppieters, Lev Shagam & Michel Georges(カロル・シャリエ、ワウテル・コピエータース、レフ・シャガム、ミシェル・ジョルジュ
寄稿
H.Y. は 16S rRNA 配列データの解析、GWAS、メタアナリシス、局所関連解析、各分類群 の遺伝率の算出、ABO 遺伝子型判定、2.3 kb 欠損が分類群存在量に及ぼす影響の解析に貢献した。J.W.は、PCoA解析、β-およびα-多様性、血縁関係とマイクロバイオーム非類似度の相関を含むマイクロバイオーム組成の分析、OTU476様株の分離、GalNAc供給実験の実施、大腸腔内のGalNAc濃度測定、MAGにおけるGalNAc輸入・使用経路の分析、ABO遺伝子型判定に貢献した。X.H.は16S rRNAの配列決定(F6)およびGWAS(F6)に参加した。Y. Zhouはメタゲノム解析、MAGsにおけるGalNAc輸入・利用経路の解析、盲腸サンプルのRNA-seqデータの解析を行い、ABOジェノタイピングに貢献した。Y. Zhangは全ゲノム配列情報からの遺伝子型データの作成、F6およびF7世代における異なる品種のゲノム寄与度の計算と予想されるマッピング分解能の定義、LD解析の実施、ABO遺伝子のeQTL解析、ABO遺伝子の特徴付けと配列解析(2.3kb欠失の定義を含む)、バランス選択と種を超えた多型解析に参加した。M.L.は、OTU476様株の分離、GalNAc供給実験、ABO遺伝子の遺伝子型解析に協力した。Q.L.は、糞便内腔のGalNAc濃度測定に協力した。S.K., M.H., H.F., S.F., X.X., H.J., Z.C., J.G.は実験に協力した。Z.Z., X.T., Z.W., H.G. and Y.H.は全ゲノムシークエンスデータからの遺伝子型データの作成に協力し、ABO領域のNanoporeデータの解析を実施しました。J.M.はモザイク集団の構築をサポートしました。H.A.はABO領域のバイオインフォマティクス解析、A対立遺伝子のde novoアセンブル、ABO対立遺伝子の進化解析に協力しました。L.S.は、ABO遺伝子型がヒトの腸内細菌叢の構成に及ぼす影響を分析した。W.C.は種を越えた多型のシークエンスデータの解析を支援した。C. Charlierは、F0、F6、F7集団におけるABO遺伝子と2.3kb欠失および対応するハプロタイプ構造の特徴づけと種を超えた多型の解析を監修した。B.Y.は全ゲノム変異体の遺伝子型データを作成し、異種株の飼育を支援し、F6およびF7世代における異なる品種のゲノム寄与度の計算と予想されるマッピング分解能の定義に参加した。M.G. はバイオインフォマティクスおよび統計解析の監修、バイオインフォマティクスおよび統計解析の実施、 論文の執筆を行った。C.Chenは、研究のコードネーム、実験の監修、腸内細菌に関するバイオインフォマティクスおよび統計解析の監修を行い、論文を執筆しました。L.H.は豚のヘテロジニアスストックを作成し、研究をデザインし、プロジェクトを指揮し、実験と分析を監修し、論文を執筆した。
協力者
Michel Georges、Congying Chen、Lusheng Huang 宛てにご連絡ください。
倫理的宣言
利益相反
著者らは、競合する利益を宣言していない。
査読
査読情報
Catherine Lozupone、Vincent Plagnol、およびその他の匿名の査読者の方々には、本論文の査読にご協力いただき、Natureに感謝いたします。査読者のレポートがあります。
その他の情報
出版社からのコメント Springer Natureは、出版された地図や所属機関に関する管轄権の主張に関して中立的な立場を維持しています。
エクステンデッドデータ 図と表
Extended Data 図1 複雑な表現型の遺伝学的解析のための大規模なモザイク豚集団の生成。
(a) 複雑な表現型の遺伝的解析のための大規模なモザイクブタ集団の生成に用いた回転育種デザイン。糞便(D25、D120、D240)、回腸(IC)と盲腸(CC)の内腔内容、回腸(IM)と盲腸(CM)の粘膜掻き取りのサンプリングスキームを有する。BX: Bamaxiang、EH: Erhualian、LA: ライウー、TB: チベット、LW: ラージホワイト、LD: ランドレース、PT: ピエトラン、WD: ホワイトデュロック (b) 8種の創始品種内および間でサンプリングした対立遺伝子配列間の平均類似度(1 - π). 色の濃さは、黒(対立遺伝子の類似度が最も低い品種:BX vs WD、1 - 4.3x10-3)から明るい赤(対立遺伝子の類似度が最も高い品種:WD、1 - 1.8x10-3 )までである。品種の頭文字は(a)と同じ。この集団では、MAF≧3%の変異体が3000万個以上、すなわち100塩基対に1個以上分離している。これは、マウスの共同交配108で分離する4000万個の高品質バリアントよりわずかに低い。(c) 平均ヌクレオチド多様性(π、すなわち集団内でランダムにサンプリングした2本の染色体間で異なる部位の割合)のヨーロッパ(Eur)とアジア(As)の家畜の間、および現代ヨーロッパ(HSEur)、アジア人類(HSAs)、ネアンデルタール(Neand)およびチンパンジー(Pan Trogl)間の比較。中国の4つの創始品種内の平均ヌクレオチド多様性は〜2.5x10-3、ヨーロッパの4つの創始品種内は〜2.0x10-3であった。これに対し、アフリカ人集団のπ値は〜9x10-4、アジア・ヨーロッパ人集団のπ値は〜8x10-4である109,110. このように、家畜化によって有効人口が著しく減少したと考えられる直感に反して、家畜ブタの集団内多様性はヒト集団の2倍以上であることが、既に報告されている111,112,113。中国の創始品種間およびヨーロッパの創始品種間の塩基多様性はそれぞれ〜3.6x10-3および〜2.5x10-3で、それぞれの品種内のπ値より1.44倍および1.25倍高い。これらのπ値はホモ・サピエンスとネアンデルタール人/デノシバン人の間の配列分岐(〜3x10-3、参考文献15)と同じオーダーである。それに比べて、アフリカ人、アジア人、ヨーロッパ人の間のπ値は典型的には≦~1x10-3である(参考文献109)。中国品種とヨーロッパ品種の間のヌクレオチド多様性は平均で〜4.3x10-3であった。このπ値はM. domesticusとM. castaneusの分岐114に近く、チンパンジーとヒトの差〜1%の半分に近い値である16。なお、中国とヨーロッパの豚の品種はそれぞれ中国とヨーロッパのイノシシに由来し、これらは100万年前に分岐したと考えられているが27、M. domesticusとM. castaneusは50万年前以下に分岐したと考えられている114。(d) F6世代とF7世代における8つの創始品種のゲノム寄与をオートソーム特異的に推定した。すべての変種を組み込んだ線形モデルを用いて、F6世代とF7世代における8つの創始品種の平均的な寄与を、ゲノムと染色体レベルで推定した56。ゲノムレベルでは、F6(F7)世代における8つの創始品種ゲノムの割合は、11.2%(それぞれ11.5%)から14.1%(14.7%)の範囲であった。染色体特異的なレベルでは、F6世代(F7世代)において、8つの創設品種ゲノムの割合は6.7%(それぞれ4.9%)から20.7%(22.1%)の範囲であった。F6世代とF7世代における創始者8品種のゲノム寄与率は、ゲノムレベルでも染色体レベルでも驚くほど均一で期待値に近い(すなわち12.5%)ことから、ゲノム全体では同程度の遺伝的多様性があることが示唆される。このことは、より詳細な調査によって、期待値からの局所的な逸脱や、非同系遺伝子座における不適合な対立遺伝子の組み合わせの過少代表が明らかになる可能性を排除するものではない。(e-f) F6世代で達成可能なマッピング分解能の指標: (e) 「インデックス」バリアントと高LD(r2 ≥ 0.9)のバリアント(「インデックス」として順次考慮するすべてのバリアントについて別々に計算した)の数の頻度分布(密度)、GWAS115における「信頼セット」の予想サイズに相当する。赤の縦線はゲノム全体の中央値に対応する。緑色の縦線は、ABO遺伝子座について本研究で達成されたマッピング分解能に対応する(以下参照)。(f)インデックスバリアントとそれと高LD(r2≧0.9)のバリアントとの最大距離の頻度分布(密度)、信頼できるセットの広がりを定義している。赤と緑の縦線は(D)と同様。
Extended Data 図2 健康なブタの腸内細菌群の年齢および場所特異的な組成の特性評価。
(a)ブタのコア腸内細菌叢の定義。F6およびF7世代の120日目および240日目の糞便および盲腸内容物サンプルの95%以上で、21分類群に注釈された合計58のOTUが同定され、それゆえコア細菌分類群として定義された。(ブタとヒトの腸内細菌叢の組成は、どちらかがマウスの腸内細菌叢の組成に近い。箱ひげ図はFig.1cと同様である。解析可能なサンプル数は、ブタ1281個、ヒト106個、マウス6個である。(c) Fig. 1bで示した43ファミリーの7種類のサンプルにおける、最も多く存在するサンプルタイプに対する存在量(F6-F7の平均がある場合)(赤-青スケール)。科は、最も多く存在する試料の種類に従って並べられている。系統の色分けはFig.1bと同じである。マウスとヒトとの比較のために列を追加した。マウスのデータはSuzuki & Nachman116のFig.1、ヒトのデータはVuik et al117のFig.6から引用した。P_I: 近位回腸, D_IL: 遠位回腸, C: 盲腸, CO: 結腸, RE: 直腸, F: 糞便. 種間の場所特異的な分布に関して最も差がある科は、Helicobacteriaceae、Veillonellaceae、Lactobacillaceae、Streptocaccaceaeであった。
Extended Data Fig. 3 モザイク豚集団における腸内細菌叢組成の遺伝率の評価。
F6世代とF7世代における、サンプルタイプ(D25、D120、D240、CC、IC)別の分類群/OTUの遺伝率推定値の相関。相関係数(r)および関連するp値(p)は、細菌数(線形モデルの残差)について事前に補正された遺伝率推定値を用いて計算された。遺伝率推定値は,確かに分類群の存在量に伴ってわずかに増加する傾向があった.しかし、この効果はD120、D240、CCで観察されたF6とF7の相関を説明することができず、真の遺伝的効果を示唆している。網掛け部分は回帰適合の95%信頼区間に相当する。相関係数と両側p値はSpearmanのランクベースの方法を用いて計算された。報告されたp値は名目上のものである(すなわち、多重検定で補正されていない)。
Extended Data 図4 全ゲノム配列に基づくGWASによる、うどんこ病菌の存在量に大きな影響を与える微生物QTL(miQTL)の同定。
(a) miQTLマッピングのために行った2種類の解析(存在量と存在/非存在)に使用したサンプルとSNPの模式図。(b) (上) 11個のデータ系列で得られた、SNP×分類群×解析モデルの組み合わせのうち、12番目のデータ系列でゲノム全体に有意なシグナル(p < 5×10-8) を得た1,527セットのp値に対するlog(1/p)値分布。(下) (上)と同じデータ系列で同じ解析モデルを用いて得られた11個のp値の1527セットのうち、MAFと分類群数について(上)と一致するSNP×分類群の組み合わせをランダムに選択した場合のlog(1/p)値の分布図。Log(1/p)値は、Methodsに記載されているようにGenABELを使用して計算された。対応するp値は名目上のもので、両側である。(c) D240糞便サンプルの平均(F6とF7)分類群遺伝率と平均(F6とF7)ゲノムワイド有意(p≦5×10-8)miQTL数との相関関係。網掛け部分は回帰適合の95%信頼区間に相当する。相関係数および関連するp値はスピアマンのものである。(d) ゲノムワイドlog(1/p)閾値7を超える1527個(SNP×分類群×モデル×1コホート内1データ系列)のQQプロット。 3)実SNPの≦5-7p値のセット(同じSNP×分類群×モデル、他コホートの全データ系列)(青:定量モデル、緑:バイナリモデル)と、MAFと存在量または存在/不在率についてマッチしたランダムに選んだSNP×分類群の組み合わせ(茶:定量モデル、黄:バイナリモデル)のマッチした≦5-7p値セットについて説明。Log (1/p)値は、Methodsに記載されているようにGenABLEを使用して計算された。対応するp値は名目上のもので、両側である。(e) (C)と同じQQプロットで、1番染色体:272.8-273.1Mb区間のすべてのSNPを除去したもの。Log(1/p)値はGenABLEを用い、Methodsに記載されているように計算した。対応するp値は名目上のもので、両側である。(f) SNP 1_272907239と31のp-75-a5 OTU(赤)および83のErysipelotrichaceae OTU(黄)の関連log(1/p)値および対応する符号付きzスコアの分布、OTU476およびOTU327と同じ符号の効果の濃縮を示す。Log(1/p)値は、Methodsに記載されているように、Metal (v3.0)を使用して計算された。対応するp値は名目上のもので、両側である。補足説明1も参照。
Extended Data 図5 第1染色体のmiQTLは、ヒトABO遺伝子のオルソログの2.3kb欠失に起因している。
(a) 染色体内組換えにおける重複したSINE配列の役割を示す2.3kb欠失のブレイクポイント。(b)AAホモ接合体におけるcG146C SNPの対立遺伝子バランスとAOヘテロ接合体における同 SNPの対立遺伝子バランスの例。(c) (上)ブタAO遺伝子のeQTL解析で、2.3kbの欠失の正確な位置で最大となり(p = 1.9x10-43)、A対立遺伝子が転写レベルを〜3倍増加する相加効果を示す(挿入図;FPKM:Fragments Per Kilobase of transcript per Million mapped Reads)。n's "は解析に利用した各遺伝子型の動物の数に相当する。箱ひげ図はFig.1cと同じ。(下)ブタABO遺伝子のゲノムワイドeQTLスキャンで、1番染色体上に強いシスeQTLシグナルを示した。報告された対数変換された p 値は名目上のものであり、両側である。(d) 12個のデータシリーズにおけるOTU327とp-75-a5の存在量に対するN-アセチルガラクトサミニルトランスフェラーゼ遺伝子型(AA、AO、OO)の影響。大腸菌の存在量に対するN-アセチルガラクトサミニルトランスフェラーゼの遺伝子型(AA, AO, OO)の影響の有無。サンプルサイズはSTable 4.1の通り。ボックスプロットはFig. 3dと同じ。 (e) 12個のデータシリーズにおけるOTU476、OTU327、p-75-a5の存在量。バイオリンプロット、中央値表示。数値(n's)はSTable 4.1の通り。補足説明2も参照。
Extended Data 図6 1番染色体miQTLK近傍のcis-eQTL解析により、2.3kb欠失の因果関係が支持される。
(a) ブタのN-アセチルガラクトサミニルトランスフェラーゼ("ABO")、GBTG1、LCN1(=OVP2B)、MED22、SURF6遺伝子に対する盲腸でのcis-eQTL解析。青い三角形は、miQTLのトップSNPに相当する。赤い三角形は、それぞれのcis-eQTLの上位SNPに対応する。N-acetyl-galactosaminyl transferaseのみ、青と赤の変異が同じである。対数変換したp値は名目上のもので、両側である。(b) 盲腸における対応する遺伝子の発現レベルに対するAO遺伝子型の影響。ABO以外のこれらの遺伝子の発現にAO遺伝子型が影響する証拠はなかった。各遺伝子のcis-eQTL解析に利用可能なAA、AO、OOのサンプル数を示した(n)。箱ひげ図はFig.1cと同様である。遺伝子型クラスのペア間の遺伝子発現レベルの差を両側t-検定で検定した。(c) 上位cis-eQTL SNPs(Aの青い三角形)がOTU476の存在量に与える影響。ABOのcis-eQTL SNPsのみがOTU476の存在量に影響を及ぼしている。各遺伝子のmiQTL解析に利用可能なAA、AO、OOのサンプル数を示す(n)。ボックスプロットはFig.1cと同様である。遺伝子型クラスのペア間の細菌存在量の差を、両側t検定で検定した。
Extended Data Fig. 7 ヒトABO遺伝子のオルソログにおける2.3kbの欠失は350万年前のもので、平衡淘汰の下にある。
(a) ブタN-アセチルガラクトサミニルトランスフェラーゼ遺伝子(ブタO対立遺伝子)の2.3kb欠失を中心とした0.5〜40kbのウインドウにおける14 AA動物と34 OO動物の塩基多様性に基づくUPGMAツリー。PA: Phacochaerus Africanus、SC: Sus cebifrons、SV: Sus verrucosus、SU: Sus scrofa vittatus、CB:中国イノシシ、RB:ロシアイノシシ、EB:ヨーロッパイノシシ、ERH:二華人、BX:浜翔、T:チベット人、LA: Laiwu、LR: Landrace、LW: Large White、PI: ピエトラン、WD:ホワイト・デュロック 背景 ブタのOアレルの年代についてさらなる洞察を得るため、家畜のブタ、イノシシ、ビサヤ豚、ジャワ豚、アフリカイボイノシシを含む14匹のAAと34匹のOOについて、AおよびOアレルの系統樹を作成した。これらの動物の局所的なSNP遺伝子型(ABO遺伝子を包含する50Kウィンドウ)を調べたところ、近位および遠位の欠失の分岐点からそれぞれ300および800塩基対という近さで、OとAのハプロタイプの間で祖先の組換えの痕跡があること、また組換え、遺伝子変換、あるいは再発性のde novo突然変異によるものかもしれない複数の相補性の事例があることがわかった。これらの特徴は、O alleleの年齢を裏付けるものである。2.3kbの欠失を中心に500bpから40kbの範囲で、塩基多様性に基づくUPGMAツリーを作成した。窓が小さいほど、真の祖先であるOとAの状態を比較できる可能性が高いが、より少ないバリアント数に基づいているため、頑健性の低い樹形となる。大きな窓は、A-Oの組み換えハプロタイプでますます汚染され、求めるシグナルがぼやけてしまう。実際、20kb以上の窓では、遺伝子木は種木に対応し、15kb以下の窓ではAA対OOの遺伝子型によって動物を並べ替える木となる。15kb以下のすべての窓で、Sus cebifronsのO対立遺伝子はSus scrofaのO対立遺伝子の外にマッピングされ、(交雑ではなく)深い分岐とそれ故にO対立遺伝子の古さが支持される。注目すべきは、1.2kb以下のウインドウでは、イボイノシシA対立遺伝子はSus O対立遺伝子よりもSus A対立遺伝子に近縁である(ED7A)ことである。このことは、O対立遺伝子がPhacochoerusとSus A対立遺伝子の分岐より古い、すなわち10MYA以上である可能性を示唆している。イボイノシシをもっと大量に調査して、同じ2.3kbの欠失がこの種や他の近縁種にも存在するかどうかを確認することは興味深いことであろう。(b)家畜のブタ(Bamaxian)、ヨーロッパとアジアのイノシシ、およびSus cebufronのO対立遺伝子の約900塩基対のアラインメントから、これらが同一のby-descentであることが示された。2.3kbの欠失を引き起こした組換え事象を媒介したと推定されるSINEエレメントは、赤で強調表示されている。文脈。家畜のブタ、ヨーロッパとアジアのイノシシ、Sus cebifronsのO対立遺伝子の約900塩基対(2.3kb欠失の位置を中心とする)を並べ、子孫による同一性をさらに確認した。その結果、配列はほぼ同一であり、我々の仮説をさらに裏付けるものとなった。また、O対立遺伝子が古かったことが、本研究で達成された驚くべきマッピング分解能(≤3 kb)に寄与しているに違いないことは注目される。F0世代で2.3kb欠失とほぼ完全なLD(r2 ≥ 0.9)を示した変異体は42個で、2,298bp(2.3kb欠失の近位側で1,522、遠位側で762)である。この2.3 kbのスパンはゲノム全体の期待値(17パーセンタイル)よりも低く、おそらく遠い過去に起こった2.3 kb欠失の誕生以来、多数のクロスオーバーが発生しているためと思われる。しかし、この小さなセグメント内の情報量の多い変異体の数は、ゲノム全体の平均値(57%パーセンタイル)よりも多く、これはおそらく、AおよびO対立遺伝子が合体した遠い時期から多数の変異が蓄積したことが少なくとも一因である(本文の図1dを参照)。(c) F6およびF7世代における肉質、成長、枝肉組成、血液学、健康、およびその他の表現型に関わる150の表現型に対するAO遺伝子型の効果についてのQQプロット。P値は、Methodsに記載されているように、F6およびF7世代にわたる混合モデルに続くメタ分析(加重Zスコア)を用いて得られた。QQプロットに使用した対数変換P値は、名目および両側である。背景 我々の発見は、霊長類におけるABO遺伝子の種を越えた多型が平衡選択に起因することを想起させる26。合成された糖鎖は病原体の付着や毒素の結合に影響を与えたり、可溶性のデコイとして機能する一方、天然に存在する抗体は病原体を防御すると考えられている20,44。ヒトでは、O対立遺伝子はマラリア118、大腸菌やサルモネラ菌の腸管感染119、SARS-CoV-142、SARS-CoV-243、住血吸虫症120,121,122から身を守る一方で、コレラ123、ピロリ124、ノロウイルス感染125に対する危険因子となり得る。どのような選択力が働いているにせよ、少なくとも2つの哺乳類(霊長類とイヌ科)において、非常に長い期間、広い地理的範囲にわたって独立して作用しているようであり、それゆえ、その普及性を示しているのである。観察されたバランスのとれた多型を支える選択的な力が何であるかを知るために、我々はブタのAO遺伝子型が枝肉組成、成長、肉質、血液学的パラメータ、耐病性および行動に関するF6およびF7世代で測定した150以上の形質に対して影響を及ぼすかどうかを検証した。免疫や病害抵抗性に関連するものを含む多重検定を考慮しても、有意な影響は認められなかった。(d) 成豚および胚豚の組織パネルにおけるAO遺伝子の発現プロファイル(自身のRNA-Seqデータ)。
Extended Data 図8 1番染色体miQTLは、AO遺伝子型内のErysipelotyrichaceae種の存在量と相関する糞便N-アセチル-D-ガラクトサミン(GalNAc)濃度に影響を与える:理論編。
(a) ブタとヒトのABOとα-galエピトープ。9q34.2に位置する糖転移酵素遺伝子がヒトのABOエピトープを支えている。 2に位置し、ヒトのABO血液型を支える糖転移酵素遺伝子は、ほとんどのヒト集団において、3つの主要な対立遺伝子によって特徴づけられている。(i) IAは、腸管内腔に分泌されるムチンを含む様々な糖タンパク質上のHおよびルイス抗原にGalNAcを付加する(A抗原をもたらす)α-3-N-アセチル-D-ガラクトサミニルトランスフェラーゼをコードしている。(ii) 同じ抗原にガラクトースを付加するα-3-D-ガラクトース転移酵素をコードするIB(B抗原)、および (iii) A抗原とB抗原のいずれをも発現しない不活性型IOヌレアレルの3種類がある。フコース転移酵素2遺伝子(FUT2)の変異は、分泌タンパク質にH抗原を形成させないため、分泌物中のAおよびB抗原の検出を不可能にする20。ヒトABO糖転移酵素遺伝子のブタオルソログは、ブタ染色体1qのテロメア末端に位置し、(i)ヒトIA対立遺伝子と同様にHおよびルイス抗原にGalNAcを付加するα-3-N-アセチル-D-ガラクトサミニル転移酵素をコードするA対立遺伝子と(ii)ヒトIO対立遺伝子と同様の2.3kb欠失によるヌル対立遺伝子に相当するO対立遺伝子によって特徴付けられている24。従って、B抗原(Galα1-3(Fucα1-2)Galβ1-4GlcNAc-R)はブタ集団では観察されない。しかし、多くの組織の細胞表面に多く見られるのは、いわゆる「α-galエピトープ」(Galα1-3Galβ1-4GlcNAc-R)で、これはGGTA1遺伝子にコードされるα1,3ガラクトース転移酵素によってGalβ1-4GlcNAc-R前躯体にガラクトースが付加された結果である。GGTA1遺伝子のオルソログは、ヒトや旧世界の非ヒト霊長類では機能しないが、異種移植片の急性拒絶反応に寄与する高タイターの抗α-gal抗体を循環している126, 127。 (b) GalNAc濃度の変化が、観察されたうどんこ病の種の存在量の変化の原因かどうかを、二つの表現型の間の相関を「AO遺伝子型内で」探すことによって明らかにすること。(b1) AO遺伝子型が、異なる分子メカニズムによって、うどんこ病菌の種類とGalNAc濃度に関連している場合(例えば、連鎖不平衡ではあるが、それぞれ異なる原因変異が関与しているため。あるいは、その遺伝子が糖転移酵素活性とは別に、細菌量の変化を引き起こすまだ知られていない別の活性を持っているため)、AO遺伝子型内の細菌量とGalNAc濃度には相関がないと考えられる(点線の中の赤い横線)。もちろん、遺伝子型を超えた相関はあるが、それはAO遺伝子型が両方の表現型に(直接的または間接的に)影響を与えるためである。(b2) 一方、AO遺伝子型がGalNAc濃度の変化を引き起こし(酵素活性が知られていることから、その可能性は高い)、それがうどんこ病菌の生息数の変化を引き起こすとすると、点線の楕円の中の傾斜した赤い線で示すように、細菌の生息数とGalNAc濃度には、AO遺伝子型の中でも相関があると予想される。これは実際のデータで観察されたことである。
Extended Data 図9 1番染色体のmiQTLは糞便のN-アセチル-D-ガラクトサミン(GalNAc)濃度に影響を与え、AO遺伝子型内のうどんこ病菌の存在量と相関する:結果。
(a) 「AO遺伝子型内」の糞便中GalNAc濃度と細菌数(上段:p-75-a5、下段:OTU327)には正の相関がある。GalNAc濃度と細菌量は、バッチ効果とAO遺伝子型について補正し、0と1の間でスケーリングして、残留分散を均等化した。相関は、全サンプルとスピアマンの順位検定を用いて計算し、対応するp値(名目値、両側)を示した(左パネル)。回帰線は、異なるAO遺伝子型について別々に示されている(右パネル);それらはすべて正である。p-75-a5の散布図は、OTU476の散布図と同一ではないが、非常によく似ている(図5b、c)ことに注意されたい。これは、盲腸内容物中のp-75-a5属のほとんどをOTU476が占めているためである(Extended Data Fig.5も参照)。したがって、これらのデータは独立したものであると考えることはできない。網掛け部分は回帰適合の95%信頼区間に相当する。(b) OO、AO、AAブタの盲腸内容物、および200mg/kgのGalNAcを摂取した無菌マウスの盲腸内容物中の遊離GalNAc濃度の比較。濃度は、凍結乾燥した糞便内容物粉末をLC-MS/MSで測定した。分析サンプル数はnで示した。ボックスプロットはFig.1cと同様。
Extended Data 図10 第1染色体のmiQTLは、GalNAc輸入・異化経路を機能的に持つ細菌に影響を与える。
(i) 2つのOTU476様株 (4-15-1 と 4-8-110), (ii) Erysipelotrichaceae科に属する248のMAG, (iii) 他の細菌科に属する2863のMAGのゲノムにおけるGalNAc TR/CP経路に関わる24遺伝子のオルソログの存在(緑), agaSに近接している(赤), または存在しない(黒). 3つのパネルの右側の2つのレーンは、それぞれRegulon(赤)とPathway(緑)のスコアに対応する。両スコアとも0(黒)から6(明るい赤または緑)までの範囲。対応するデータセットの平均値(範囲)は上部に示されている。パスウェイとレギュロンのスコアのP値(名目、両側、補正なし)は、Methodsに記載されている線形モデルを用いて計算された。
Extended Data 図11 miQTL感受性のあるGalNAc利用菌と感受性のないGalNAc利用菌で異なるGalNAcオペロン構造とトランスクリプトーム応答。
2つのOTU476様株のうちの1つ(注:GalNAc遺伝子群の構成は4-15-1株と4-8-110株で同一)と、それぞれErysipelotrichaceae, E. coli (enterobacteriaceae), Collinsella (Coriobacteriaceae), Fusobacteriaceae, Firmicutes and Clostridiumに属する6つのMAGsにおけるGalNAc "operons" マップを掲載する。同定されたOpen Reading Frames (ORF)はカラーボックスで表示されている。GalNAcの輸入と異化に関与する遺伝子は、クラスターに含まれる場合は赤で、ゲノムの他の場所にある場合は緑で表示されている。GalNAcとは無関係の機能が知られている遺伝子は青色で表示されている。グレーは遺伝子産物が未解明なORF。遺伝子の頭文字は対応するボックスの横に記した。上(それぞれ下)鎖から転写されるORFは点線の上(下)にある。それぞれの転写の方向は矢印で示した。地図上の順序を確認するために使用した情報源(完成したゲノム、複数のMAG、単一のコンティグ)が示されている。
Extended Data 図12 ヒトの腸内うどんこ病菌の量にABO遺伝子型は影響しない。
Erysipelotrichaceaeに分類される43 (V1-V2), 20 (V3-V4), 9 (V5-V6) OTUのVolcanoおよびQQプロットは、(a) [AA, AO and AB] 対 [BB, BO and OO], (b) [BB, BO and AB] 対 [AA, AO and OO], (c) [OO] 対 [all others] の対比で示したもの。網掛け部分は、QTLが存在しないという帰無仮説の下でのQQプロットの広がりの95%信頼区間に対応するものである。実際のポイントは常にこれらの区間内にあり、帰無仮説を棄却することはできない。P値(名目、両側)は、方法と以降で説明する線形モデルを使用して計算された。補足の議論3も参照。
補足情報
補足情報
補足説明1-3.
報告書の概要
ピアレビューファイル
補足表1-7
権利と許可
転載と許可
この記事について
CrossMarkで通貨と真偽を確認する
この記事を引用する
Yang, H., Wu, J., Huang, X. et al. ABO遺伝子型は、豚のGalNAcレベルを調節することで腸内細菌叢を変化させる. Nature 606, 358-367 (2022)。https://doi.org/10.1038/s41586-022-04769-z。
引用文献のダウンロード
受付終了
2020年7月29日
受理済
2022年4月19日
公開
2022年4月27日発行
発行日
2022年6月9日