BugSigDBは幅広い宿主関連微生物シグネチャーの存在量差パターンを捉える

本文へスキップ
ネイチャーバイオテクノロジー
検索
ログイン
コンテンツ
Natureについて
掲載
記事
PDFダウンロード
PDFダウンロード
記事
オープンアクセス
公開日:2023年9月11日
BugSigDBは幅広い宿主関連微生物シグネチャーの存在量差パターンを捉える
https://www.nature.com/articles/s41587-023-01872-y



ルードヴィッヒ・ガイストリンガー、クロエ・ミルザイ、...レヴィ・ウォルドロン 著者一覧を見る
ネイチャーバイオテクノロジー (2023)この記事を引用する

4151 アクセス

69 Altmetric

指標詳細

要旨
ヒトをはじめとする宿主関連マイクロバイオーム研究の文献は急速に拡大しているが、宿主関連マイクロバイオームシグネチャの存在量差に関する発表結果の系統的な比較は依然として困難である。BugSigDBは、研究地理、健康アウトカム、宿主体部位、実験的・疫学的・統計的手法に関する情報とともに、発表された存在量の差に関する研究から得られた微生物シグネチャーを手作業でキュレーションした、コミュニティ編集可能なデータベースである。このデータベースの初回リリースでは、3つの宿主種に関する600を超える公開研究から、2,500を超えるシグネチャーが手作業でキュレートされており、シグネチャーの類似性、分類群の濃縮、共起・共排除、コンセンサスシグネチャーのハイスループット解析が可能である。これらのデータにより、実験条件、環境、体の部位内および部位間でのマイクロバイオームの存在量の差異を評価することができる。データベース全体の解析により、独立した研究によって報告されたシグネチャの一貫性が最も高い実験条件が明らかになり、口腔病原体の腸内への頻繁な侵入など、疾患に関連するシグネチャの共通点が特定された。

主な内容
ヒトマイクロバイオームの培養に依存しないプロファイリングのための実験的手法や計算手法が大幅に進歩したにもかかわらず、微生物の存在量の差に関する研究の解析や解釈は依然として困難である。ヒトや動物モデルを用いた実験的・観察的研究の多くが、宿主に関連するマイクロバイオームと、動脈硬化1、心血管疾患2、がん3、糖尿病4など様々な疾患の発症・進行・治療との関連を報告している。このように発表された結果が増え続けていることは、蓄積された知識を統合し、さまざまな疾患や曝露に共通するパターンを特定し、過去の結果と比較することで新たな研究を解釈する機会を提供している。しかし、発表された存在量の差異の結果を系統的にカタログ化しなければ、異なる研究分野で報告された同一の微生物シグネチャーでさえも、注目されることはないだろう。研究分野内であっても、存在量の差分結果のカタログや共通報告がない場合の系統的レビューは時間がかかり、静的で、一般的に報告されたすべての分類群を要約することはできない。

この状況は、遺伝子発現差解析の解釈における初期の課題5と類似しており、この分野では遺伝子セット濃縮解析(GSEA)によって対処されてきた。GSEAは、生物学的機能や特性を共有する、あるいは以前の研究で一緒に同定された、あらかじめ定義された遺伝子シグネチャーの間で首尾一貫した発現パターンを比較することができる6,7。GSEAは遺伝子発現データ解析6における重要なツールであり、遺伝子間の相関9、機能アノテーションの冗長性10、様々なタイプの帰無仮説11、ゲノム領域12、メタボロームデータ13、疾患表現型14の解析へのGSEAの応用など、幅広い後続手法8がある。

同様に、微生物の存在量の差分解析は、目的の表現型と関連する複数の分類レベルでの微生物クレードのリストまたは「シグネチャー」を得ることができる。これらのクレードが共有する特性は、多くの場合明らかではないが、共通の環境暴露、代謝や生態学的要件、あるいは生理学的特性などが考えられる。GSEAの概念をマイクロバイオームの存在量差解析の結果に適用しようとする初期の試みは存在する15,16,17,18が、大きな障害となって、その広範な有用性と採用が妨げられている。最も顕著な障害は、Gene Ontology19、KEGG20、MSigDB21,22、GeneSigDB23など、GSEAで利用できるような、濃縮解析用にデザインされたシグネチャーの包括的なデータベースがないことである。いくつかのデータベースは、微生物の生理学や形態学に関する重要な情報を提供しているが24,25,26,27、濃縮解析用に設計されておらず、設計上、ヒトや他の宿主関連マイクロバイオーム研究で研究されているがん、炎症、食事、または他の条件に関連する実験的に得られた微生物シグネチャーの大部分は除外されている。

本研究では、公表されている微生物シグネチャーのハイスループットな比較を可能にするために、主に2つの貢献を行う。第一に、BugSigDBについて説明する。BugSigDBは、宿主関連マイクロバイオームに関する文献の広範な範囲にわたって、再現可能な存在量の差のパターンを捉えるのに十分な規模と多様性を持つ、公表された微生物シグネチャーのデータベースである。BugSigDBは、幅広い健康アウトカム、医薬品の使用(抗生物質など)、動物モデル実験、無作為化臨床試験、微生物属性に関連する、異なる存在量の微生物シグネチャのキュレーションされた発表済みシグネチャを提供し、コミュニティによる投稿、修正、品質管理のためのレビューを可能にするWikipediaの技術に基づいて構築されている。第二に、何百もの発表されたマイクロバイオーム研究の結果を系統的に分析し、16Sアンプリコンやショットガンシーケンスアプローチの間でも再現性のあるパターンを特定することで、新しいマイクロバイオーム研究の解釈が、以前に発表されたシグネチャーとの系統的な比較によってサポートされることを実証している。データベース全体の解析から、シグネチャー内の微生物の共起と相互排他性の共通パターンが明らかになり、独立した研究によって報告されたシグネチャーの一貫性が最も高い実験条件として、抗生物質治療とヒト免疫不全ウイルス(HIV)感染が特定された。個々の大腸がん関連糞便中マイクロバイオームデータセット10件(N=663)の「バグセット」濃縮解析では、陽性対照として使用されたメタ解析公表シグネチャーが検出され、遺伝子セット解析や分類学を考慮した濃縮法から適応した手法の直接適用が支持された。この解析では、腸内の口腔病原体の頻度上昇など、他の疾患のシグネチャーの共通性も同定され、すべての疾患や関連する疾患、あるいは1つの疾患に特有の、共起や相互排除の最も一般的なパターンも同定された。BugSigDBデータベースとその解析方法を組み合わせることで、公表されている微生物シグネチャーと系統的に比較することができ、新たなマイクロバイオーム研究の解釈を向上させることができる。

結果
発表された微生物シグネチャーのデータベース
BugSigDBは、ヒト、マウス、ラットの公開マイクロバイオーム研究から、宿主に関連する微生物シグネチャーを手作業でキュレーションした包括的なデータベースである(図1)。このデータベースは、社内でトレーニングを受けた25人以上のキュレーターの貢献により、4年以上かけて同時に開発・拡張され、現在では600以上の科学論文から抽出された2,500以上の微生物シグネチャーが含まれている(図1a)。キュレーションされた論文は20年にわたるマイクロバイオーム研究をカバーしており、大半の研究は過去5年間に発表されたものである(628論文中459論文、73.1%;補足図1)。これらの論文の中には、50カ国以上の参加者を対象としたマイクロバイオーム研究が含まれており、その50%以上が中国と米国を起源とする研究である(それぞれ201研究と157研究;図1b)。

図1:実験的に得られた微生物シグネチャーのキュレーション・データベースBugSigDB。
図1
a-c,BugSigDBは、宿主関連微生物(細菌、古細菌、真菌、原生生物、ウイルスを含む)の発現量が異なることを報告したマイクロバイオーム研究のコミュニティ編集可能なコレクションであり、現在4年以上にわたる600以上の科学論文から抽出された2,500以上の微生物シグネチャーを含む(a)。これらの論文は、異なる国や民族地理を代表する参加者のマイクロバイオーム研究(b)、および異なる人体部位からのマイクロバイオームサンプル(c)を報告している。BugSigDBのシグネチャーには、NCBI Taxonomy29に基づいて標準化された門から株までの分類学的レベルが含まれている。 e, シグネチャーの大きさ。50%以上のシグネチャーに5種類以上の微生物が含まれている。 f, Experimental Factor Ontology32に従って各シグネチャーに関連する研究条件を分類した場合、主要な疾患カテゴリーにアノテーションされたシグネチャーの割合。

フルサイズ画像
UBERON Anatomy Ontology28(補足表1)に従って、60以上の精緻な解剖学的部位からなる14の広範な身体領域からのマイクロバイオームサンプルを研究した結果、BugSigDBの研究の大部分は、腸(628研究中440研究、70.1%)、口腔(628研究中80研究、12.8%)、および膣マイクロバイオームサンプル(628研究中59研究、9.4%)を解析した(図1c)。シグネチャーは16Sアンプリコンシーケンス(92.5%)とメタゲノミックショットガンシーケンス(MGX;7.5%;表1)の両方によって作成され、NCBI Taxonomy29に基づいて標準化された門から株までの分類学的レベルを含んでいた(補足図2)。BugSigDBは、https://bugsigdb.org で利用可能なセマンティックMediaWiki30ウェブインターフェースとして実装されており、データ入力、セマンティック検証、品質管理、研究、実験、シグネチャー、個々の分類群に対する注釈へのウェブベースのプログラムアクセスをサポートしている(補足図3、およびMethodsの「データ入力、検証、アクセス」)。

表1 BugSigDBにおけるメタデータ注釈の概要
フルサイズの表
BugSigDBに含まれる約1,400のユニークな分類群のほとんどは、5つ以下のシグネチャーで異なる存在量として報告されている(1,370のユニークな微生物のうち1,009、73.6%;図1d)。逆に、Streptococcus属、Prevotella属、Bacteroides属、Lactobacillus属は、それぞれ100以上のシグネチャーで差次的発現量として報告されている。これは、これらの属に属する種の多さを反映しており、特定の遺伝子がしばしば不均衡に差次的発現量として報告される遺伝子シグネチャーの過去の観察と類似している31。シグネチャーには平均して6種類の微生物が含まれ、シグネチャーの約55%は5種類以上の微生物を含んでいる(図1e)。

各シグネチャーに関連する研究条件は、Experimental Factor Ontology32に従って分類され(図1f)、異なるタイプのがん(23.1%)、喘息や子宮内膜症などの解剖系疾患(22.6%)、肥満や糖尿病などの代謝性疾患(15.3%)に関連する割合が高い。BugSigDBのシグネチャーのかなりの割合が、異なる疾患カテゴリーとは別に、食事(6%)、抗生物質の使用(4.8%)、出産形態(経膣と帝王切開の違い:4.1%)とも関連している。これらの分布はヒトのマイクロバイオームに関する文献をほぼ反映している。非ヒト宿主種については、データベースはあらゆる宿主生物をサポートできるものの、依然として十分な割合が得られていない。

最も多く報告された10分類群について、条件特異的な関連を調べた(図1g)。例えば、Bacteroides属を含むシグネチャーは、全シグネチャー(13%、P = 0.003、χ2 = 8.4、d.f. = 1、両側比例検定)よりも代謝性疾患(21%)に関連する頻度が高い。Bacteroidesは同様に抗生物質への暴露のシグネチャーに富んでいる(Bacteroidesを含むシグネチャーの11%が抗生物質への暴露と関連しているのに対し、全シグネチャーの5%;P = 0.0009, χ2 = 11.2, d.f. = 1)。BugSigDBは、関連する研究グループ間のこのような共通性を簡単に特定することができ、データベースが大きくなるにつれて、これらの関連性を継続的に更新することができます。

キュレーションされたメタデータとマイクロバイオーム研究における一般的な手法
BugSigDBは、研究(研究デザインと自動生成された引用情報)、差分存在量解析のための1つのコントラストを定義する研究内の実験(研究被験者に関する特徴、ラボ解析、統計解析、α多様性など)、1つの実験内で最大2つのシグネチャー(各シグネチャーは1つ以上の分類子を含む)のレベルでキュレーションされたメタデータを提供します(研究と実験の要約統計は表1、デザインの詳細はMethodsの「意味概念の定義」を参照)。本稿では、症例対照研究における症例、曝露対照研究における曝露群、および2標本群の他の比較における微生物の相対量が増加した関心状態に対応するいずれかの群を指すために「研究群」を使用する。

症例対照研究(281件、44.7%)と横断研究(171件、27.2%)が最も多く、前向きコホート研究(66件、10.5%)、時系列/縦断研究(51件、8.1%)、実験室研究(29件、4.6%)、ランダム化比較試験(28件、4.4%)、メタアナリシス(6件、0.9%)も存在した。研究対象者の情報には、宿主種(1,223実験の95.9%がヒト)、場所、状態、身体部位(図1)、抗生物質の排除基準(排除時間の中央値=60日)、研究サンプル群と対照サンプル群のサンプル数(総サンプル数の中央値=25)が含まれる。

BugSigDBにおける存在量の差の検定に最も頻繁に適用されている統計手法の調査では、Wilcoxonの家族検定や関連するLEfSeソフトウェア33のようなノンパラメトリック検定が最も頻繁に使用されている一方で、最近提案されたマイクロバイオームデータの組成性を考慮した存在量の差の検定ツール34はほとんど使用されていないことが明らかになった(補足結果セクション1.1)。さらに、体の部位や状態によって実験を層別化すると、口腔と膣のサンプルは、研究グループにおいてα多様性が増加していることが頻繁に報告されたのに対し、消化管のサンプルは、研究グループにおいてα多様性が減少していることが頻繁に発見された(補足表2-4)。

研究間で再現可能なマイクロバイオームの変化を示す条件
BugSigDBは、アバンダンス差研究のメタ解析を容易にし、マイクロバイオームの変化が研究間で再現される実験条件や疾患表現型の同定を可能にする。発表された311研究のヒト糞便サンプルから得られた1,194シグネチャーに焦点を当て、条件内でのシグネチャーの類似度を計算し、その結果得られた類似度がランダムにサンプリングされたシグネチャーの類似度を超えているかどうかを評価した(図2)。これにより、同じ表現型のシグネチャーが研究間で再現されるかどうか、また異なる表現型が類似した微生物シグネチャーを共有しているかどうかが同時に判定される。

図2:BugSigDBにおけるシグネチャーの類似性の分析により、研究間で再現可能なマイクロバイオームの変化を持つ条件が特定される。
図2
a,同一部位について少なくとも2つの研究から得られたシグネチャーの類似性解析。シグネチャーは、存在量の変化の方向によって、研究グループで存在量が減少したシグネチャー(左)と増加したシグネチャー(右)に層別化された。調査条件において、存在量が減少したシグネチャーの再現性が最も高い条件(上)と存在量が増加したシグネチャーの再現性が最も低い条件(下)に分けられた。各条件のシグネチャーの意味的類似度(y軸)が、ランダムにサンプリングしたシグネチャーの意味的類似度(片側リサンプリング検定)を超えるかどうかを検定して得られた名目P値(x軸、負の対数スケール)を示す。各ドットの大きさは、その条件を調査した研究の数に対応する;HPVはヒトパピローマウイルス。 b-e、上位にランクされた2つの条件をより詳細に調査した例:HIV感染者の存在量が減少した糞便シグネチャー(bとc)と抗生物質で治療された人の存在量が減少した糞便シグネチャー(dとe)。シグネチャー間の意味的類似性をbとdに示す。各ノードの大きさは、シグネチャーの分類群数に比例する。より類似したシグネチャは、より短く太いエッジで接続されている。シグネチャーは意味的類似性によってクラスタ化され、シグネチャー間の各属の相対頻度はカラースケールで示される。含まれる分類群の表示は、少なくとも2つのシグネチャーに出現する属に限定している(完全なシグネチャーは補足図5と6に示す)。その他の引用文献 37,38,39,40,41,42,43,44,45,46,47,48,49.

フルサイズ画像
このために、シグネチャー間の類似度を計算するための2つの代替アプローチを適用した: (1)属レベルで調和されたシグネチャー間のペアワイズオーバーラップに基づく、より制限的なJaccard指数35と、(2)混合分類学的レベルのシグネチャー間の分類学的距離に基づく、より感度の高い意味的類似度36である(Methodsの「シグネチャーの類似度」)。BugSigDBでこれまでに報告された属が優勢であることを反映し、両類似度指標によるシグネチャ類似度の階層的クラスタリングは良い一致を示したが、Jaccard類似度の適用で得られた疎な結果よりも、意味的類似度を用いた方がより良い解像度を示した(補足図4)。ショットガンメタゲノミクスによって種レベルの結果が報告されるようになり、BugSigDBの分類学的ランクが混在するようになると、意味的類似性の利点が大きくなる可能性がある。

同じ条件の独立した研究による再現性を評価するために、1つの条件で報告されたシグネチャーの意味的類似性を、繰り返しシミュレーションでランダムにサンプリングされたシグネチャーの類似性と比較し、得られた経験的P値に基づいて条件をランク付けした(図2a)。抗生物質治療とHIV感染による存在量の差のシグネチャーは最も一貫性があり、BugSigDB37,38,39,40,41,42,43,44,45,46,47,48,49で5つ以上の研究がそれぞれ調査している。抗生物質投与後に存在量が減少したシグネチャー(意味的類似度=0.64、片側リサンプリングP=0.0005;図2d,eおよび補足図5)を詳しく調べると、短鎖脂肪酸産生菌であることが多い潔癖性嫌気性菌の属が濃縮され、BifidobacteriumとBlautiaが頻繁に消失していることが明らかになり、過去の報告と一致した50。しかし、HIV感染者と非感染健常者の間で存在量が減少したシグネチャー(意味的類似度=0.68、リサンプリングP=0.002;図2b,cおよび補足図6)は、胃腸の炎症に関連する疾患で一般的に観察されるように、健常な腸内微生物群集の豊富なメンバーの減少を示した51が、日和見感染症や関連感染症を予防または治療するためにHIV感染陽性者にしばしば処方される抗生物質の副作用である可能性が高い52。さらに、研究間で再現可能なマイクロバイオームのシフトの例として、(1)集中治療室や抗生物質治療に関連した変化を示したコロナウイルス疾患2019(COVID-19)の個体における存在量の減少した糞便シグネチャーの類似性53(補足図7)、および(2)一貫して増加したストレプトコッカス、ラクトバチルス、プレボテラの存在量によって駆動される胃がん個体の胃シグネチャーの類似性(補足図8)が挙げられた。

大腸がんシグネチャーのBugセット濃縮解析
EnrichmentBrowserパッケージ7,55の濃縮法を系統的にベンチマークし、トップクラスの遺伝子セット濃縮法をマイクロバイオームデータに直接適用できるかどうかを評価するために、BugSigDBのシグネチャーをcuratedMetagenomicData54の手動でキュレートしたメタゲノミックデータセットと統合した。遺伝子セット解析手法の過去のベンチマーク7で良好な結果を示した2つの濃縮手法(overrepresentation analysis (ORA11)とpathway analysis with downweighting of overlapping genes (PADOG31))をcuratedMetagenomicDataの10個の大腸がんデータセットに適用した。BugSigDBのすべてのマイクロバイオームシグネチャーの濃縮解析を同時に行い、このデータセットに含まれる8つの研究からの個々の参加者データ56,57の2つの独立したメタ解析によって以前に導出された大腸がん関連糞便マイクロバイオームの2つのシグネチャーを「スパイクイン」対照として使用した(図3)。したがって、メタアナリシスに基づく2つのシグネチャーは、大腸がんシグネチャーの関連性とサンプルサイズが大きいことから、メタアナリシスのための8つのトレーニング研究、および残りの2つの独立した研究において、両方のデータセットで共有されているため、すべてのマイクロバイオームシグネチャーの中で最も濃縮されたシグネチャーの1つであると予想される。したがって、2つのメタ解析シグネチャーは、解析に含まれなかったサンプルサイズの小さい研究からの偽シグナルに対して頑健であるとも考えられる(補足結果3.2節、補足表5、6)。

図3:バグセット濃縮解析により、ヒトマイクロバイオームと大腸がんおよびその他の疾患表現型との関連が明らかになった。
図3
a, 10のメタゲノムデータセットからプールされた662の大腸がんサンプルと653のコントロールサンプルの間のBugSigDBシグネチャーのORA。各ドットはBugSigDBから得られた濃縮されたシグネチャー(偽発見率P値(Padj)<0.05、片側フィッシャーの正確検定、カラースケール)に対応する。各ドットの大きさは、シグネチャー中の差次的に豊富な属の数に対応し、x軸上の割合として与えられる。アスタリスク(*)は、Thomasら56とWirbelら57による先行メタ解析シグネチャーを示し、これらは8つの大腸がんデータセットのメタ解析から有意に豊富な種と属を報告した。これらのシグネチャーが導き出された時点で、濃縮についてテストされたデータセットのいくつかが含まれていたため、これらは陽性対照として機能する。 b, aの過剰発現解析から濃縮された上位15シグネチャー(y軸)において、差次的に豊富な属(x軸)。x軸は各属の出現頻度の高い順にソートし、y軸はシグネチャー間のJaccard類似度でソートしている。 c, 10個のメタゲノムデータセットに個別に適用した場合の、全シグネチャーに対するORA、PADOG、CBEAの両メタ解析シグネチャーの順位(y軸)のパーセンタイル(x軸)。番号記号(#)は、Thomasら56とWirbelら57のメタアナリシスではトレーニングセットとして含まれていないデータセットを示す。 d, cに示したn = 10の独立したデータセットについて、両側Wilcoxonの符号順位検定を用いて、3つの方法間のパーセンタイルランクの統計的有意差を評価。箱ひげ図は、中央値(縦線)、四分位範囲(箱)、±1.5×四分位範囲(ひげ)を示す。その他の引用文献(文献97,98,99,100,101,102,103,104,105,106,107,108,109,110,111,112,113)。

フルサイズ画像
647のBugSigDBシグネチャーのORAにより、10のデータセットから662の大腸がんサンプルと653のコントロールサンプルを用いて、コントラストに富む19のシグネチャーが得られた(偽発見率P値<0.05、片側フィッシャーの正確検定;図3a)。いずれかの状態に関連する5つ以上の属を含むシグネチャーのみが含まれた。Thomasら56とWirbelら57の2つの陽性対照スパイクインシグネチャーが、予想通り上位にランクされた。他の濃縮されたシグネチャーには、Wuら58とAllaliら59の大腸がんシグネチャーが含まれる。これらは、どちらの研究もメタ解析のシグネチャーを計算した10個のデータセットに含まれていなかったので注目される。さらに、両者とも16Sアンプリコンシーケンスに基づいていたのに対し、メタ解析のシグネチャーはショットガンシーケンスに基づいていた。したがってこの解析は、ショットガンメタゲノムデータから得られた種レベルのシグネチャーと、16Sアンプリコンプロファイルから得られた属レベルのシグネチャーを統合するための概念実証にもなり(Methodsの「Bug set enrichment analysis」)、Thomasら56とWirbelら57のシグネチャーを独立に再現することもできる。

歯肉炎、消化性食道炎、口腔がんなどの口腔疾患の研究から得られた唾液検体から11の濃縮シグネチャー(58%)が検出されたことは、口腔から腸への微生物導入が大腸がんの特徴であるという最近の報告60や、歯周病が大腸がんの確立された危険因子であるという報告61,62と一致している。濃縮されたシグネチャーの間で頻繁に重複する属には、Fusobacterium、Porphyromonas、Peptostreptococcus が含まれ、いずれも健常対照群と比較して大腸がん患者の存在量が強く増加していた(図 3b)。

これらの知見は、マイクロバイオームシグネチャーのための迅速かつ効果的な濃縮法としてORAの有用性を示すものであるが、この方法には相関性のある特徴63や不適切に大きな特徴ユニバース64が存在する場合の欠点があることが知られている。いくつかの独立した評価7,65,66でトップパフォーマーであるPADOG法は、相関関係を保持するためにサンプルの並べ替えを適用し、完全な存在量行列で動作することにより、差分存在量の閾値や特徴ユニバースの定義を必要としないため、理論的に優れている。さらに、この方法は、シグネチャー間で頻繁に重複する微生物(図1dに表示されているような)の重みを減らし、感度を向上させ、調査中の表現型に対してより特異的なシグネチャーを同定することにつながる。

そこで、大腸がんの10個の参加者ショットガンメタゲノミクスデータセットそれぞれについて、PADOGとORAのベンチマークを行い、Thomasら56とWirbelら57のメタアナリシスによる2つのスパイクインシグネチャーの順位を比較した(図3c)。平均して、PADOGはORAよりもスパイクインシグネチャーの順位が高かったが、その差はThomasら56のスパイクインシグネチャーでのみ統計的に有意であった(P = 0.049、両側Wilcoxon符号順位検定;図3d)。この差はサンプルサイズが小さいデータセットで最も大きく、検出力の不足はPADOGよりもORAでより不利であった(補足図9)。

確立された遺伝子セット濃縮法がマイクロバイオームデータに適用するのに有効であることは明らかであるが、これらの方法はマイクロバイオームデータを念頭に開発されたものではない34,67。Competitive balances for taxonomic enrichment analysis (CBEA18)は、特にマイクロバイオームデータ用に開発された最新の分類学的濃縮法で、サンプルレベルの濃縮スコアを計算するために、相対存在量データの等比対数比変換を適用することにより、組成性を考慮している。大腸がんを対象にORAおよびPADOGと比較した結果(図3c)、CBEAはThomasら56のスパイクインシグネチャーをORAより有意に上位にランク付けする傾向があったが(P = 0.021、Wilcoxon signed-rank検定)、PADOGに対する顕著な性能向上は見られなかった(P = 0.92、図3d)。

シグネチャ内の微生物の共起性と相互排他性
BugSigDBは、異なる身体部位における存在量の差のあるシグネチャー内の構成パターンを探索することができる。発表された311の研究から得られた1,194の糞便微生物群のシグネチャーに注目し、個々の微生物と微生物群について、共起性と相互排他性のパターンを分析した(図4)。糞便サンプルのシグネチャーにおいて、最も高い頻度で差次的存在量が報告された上位20属を調べたところ(図4a)、主にファーミキューテス門(13属)とバクテロイデーテス門(4属)に属する属が見つかり、ヒトの腸内細菌叢68,69の主要な門であることと一致した。20属のうち、バクテロイデス属、プレボテラ属、ルミノコッカス属は、相対的な存在量に大きなばらつきがあり70、腸内細菌叢のクラスタリングに大きな影響を与える3つの支配的な腸内細菌属であった71。

図4:BugSigDBにおける微生物の共起性と相互排他性から、存在量に差があるシグネチャーの中に、繰り返し出現する分類群の存在が明らかになった。
図4
a,311の発表済み研究から得られた1,194の糞便微生物群のシグネチャーにおける微生物-微生物共起性と相互排他性。グループ1における存在量」は、これらのシグネチャーの研究グループにおいて、異なる存在量として最も頻繁に報告された上位20属を示している。星印は、主に一方向性、つまり研究グループにおいて存在量の増加または減少が特異的に報告される傾向にある微生物を示す(割合の2倍以上の差に基づく)。有病率」は、68の異なる研究からプールされた9,623の健康な成人の便サンプルにおけるこれらの属の有病率を示す。一番上のヒートマップは、これらの上位20属の間の共起性を示しています。つまり、これらの微生物が、存在量の変化の方向が同じ(つまり、存在量の増加または減少のシグネチャのどちらかで一緒に発生する)差次的な存在量として、いくつのシグネチャで一緒に報告されているかを示しています。下のヒートマップは、これらの上位20属の間の相互排他性、つまり、これらの微生物が、存在量の変化の方向が反対(つまり、一方の微生物が存在量の増加のシグネチャーで、他方の微生物が減少のシグネチャーで、またはその逆)で、異なる存在量として報告されたシグネチャーの数を示している。b, a.で大きさの異なる円で示した健常成人の便検体における上位20属間のスピアマン相関。 c, a.で示した健常成人の便検体におけるこれらの属の有病率(x軸)に対する、上位20属のそれぞれが研究グループにおいて存在量の増加が報告されたシグネチャーの割合(y軸)。エラーバンドは、線形回帰フィットの95%信頼区間を示す。

フルサイズ画像
調査標本群でこれらの属の存在量が増加または減少したと報告されたシグネチャーの割合を比較すると(図4a、グループ内の存在量)、調査グループで最も不釣り合いに増加した属は、Enterococcus属(シグネチャー73件中64件、87.7%)、Lactobacillus属(105件中73件、69.5%)、Veillonella属(74件中50件、67.6%)、Streptococcus属(128件中83件、64.8%)であった。ある種の連鎖球菌と腸球菌の病原性についてはよく知られているが72,73、一方、乳酸桿菌とベヨネラは通常、病原性が限定的な常在腸内細菌叢と考えられている74,75。研究グループで減少した属は、抗炎症活性が確立されている有益な腸内細菌であるRoseburia(103人中77人、74.8%)と、様々な疾患との保護的および有害な関連が報告されているAlistipes(88人中61人、69.3%)であった77。

疾患表現型における存在量の差の頻度が、健康な腸内細菌叢における有病率によってどの程度説明できるかを明らかにするために、curatedMetagenomicDataの68の異なる研究から得られた健康な成人参加者の9,623の便サンプルにおけるこれらの属の有病率と、これらの知見を対比した(図4a、有病率)。その属の相対存在量がゼロでないコントロールサンプルの割合として測定される有病率と、その属が疾患において存在量の増加が報告されているBugSigDBシグネチャーの割合の間には強い負の相関が観察された(r = -0.84, P = 3 × 10-6, 両側ピアソン相関検定; 図4c)。このことは、BugSigDBに存在する多くの疾患や曝露において、有病率の高い属は対照群に比べて研究群で失われる傾向があり、有病率の低い属は研究群で存在量が増加することを示している。これは特にEnterococcus属で明らかで、健康なサンプルでは低い有病率(13%)であったEnterococcus属が、罹患群ではほぼ独占的に増加したことが報告された(73シグネチャ中64シグネチャ、88%)。Enterococcus属の存在は、Clostridia属の他の属の除外を伴っており(下記)、したがって、一般的に報告されている「dysbiotic」シグネチャーと考えられる。

ヒトの腸は、微生物が競争したり協力したりする複雑な生態系である78。このような相互作用のどれが疾患と関連しているかを調べるために、我々は次に、発現量の差として最も頻繁に報告される上位20属について、共存と相互排他性のパターンを調べた。各組の微生物について、相対的存在量の変化の方向が同じか反対のどちらかで報告されたシグネチャーの数を数えた(図4a、上下のヒートマップ)。その結果、主に機能的・系統学的類似性に起因する共起クラスターが形成され、バクテロイデス門の属が頻繁に共起し、クロストリジア綱では正の関連性のブロックが形成された(図4a、上の赤いヒートマップ、上から3番目のクラスター)。しかし、相互に排他的なクラスターは、腸内細菌叢で確立されたファーミキューテス(Firmicutes)-バクテロイデーテス(Bacteroidetes)勾配68と、バクテロイデーテス門内のバクテロイデス(Bacteroides)とプレボテラ(Prevotella)間の強い負の関連を示す明らかな兆候を示した。全体として、これらのパターンは健康な成人の便サンプルにおけるこれらの属の相関関係をほぼ再現しており(図4b)、これらの属の間に特定の病気を促進する相互作用が存在することを否定している。例外は、クロストリジウム属、腸球菌属、連鎖球菌属で観察されたような、疾患に関連するシグネチャーにおけるクロストリジウム属内の顕著な相互排他性のパターンで、これは健常検体では観察されなかった。

プールされた微生物シグネチャーにおける共有パターンと排他パターン
BugSigDBは、微生物バイオマーカーを発見する機会を提供し、従来よりもはるかに大規模で不均一なデータソース全体にわたって、過去の知見を再評価します。体内および体部位間の微生物シフトの類似性を同定するために、一度に1つの体部位について、また一度に1つの条件について体部位内のシグネチャーを集約した(Methodsの "Signature pooling")。研究間のサンプルサイズの違いを考慮するため、プールされたシグネチャーの各分類群に、報告研究の集約サンプルサイズに基づく重み付けを行う投票法を適用し、重み付けされたメタシグネチャー間のペアワイズ類似性に基づく階層的クラスタリングを行った(図5)。BugSigDBの少なくとも2つの研究によって研究された身体部位を表す27のメタシグネチャーをクラスタリングし、研究グループにおいて存在量の差分が増加または減少した1,909の個々のシグネチャーから生成した結果、2つの主要な身体部位クラスタが得られた:主に口腔と鼻の部位からなるクラスタと、膣と消化管の部位が支配的なクラスタである(図5a)。このクラスタリングは、クラスタリングに使用した類似性尺度にほとんど影響されず(補足図10)、宿主の体内部位に由来する、特に酸素の利用可能性に支配的な影響があることが確認された。

図5:プールされた属レベルの微生物シグネチャーは、疾患表現型間で強固な身体部位特異性と腸内異常叢の共有パターンおよび排他的パターンを示す。
図5
a,BugSigDBの少なくとも2つの研究によって研究された宿主の身体部位を表し、1,909の個々のシグネチャーから生成された27のメタシグネチャー(y軸)のクラスタリング。クラスタリングは、膣および消化管部位(上)と口腔および鼻腔部位(下)の分離を示している。メタシグネチャー全体で、門ごとに色分けされた合計560の異なる属(x軸)が観察された。各メタシグネチャーに含まれる属の数を左の棒グラフに示す。次の3つのパネルには、メタシグネチャー間で頻繁に出現する属(「共有」)、体部位のいずれかのクラスターで主に出現する属(「区分化」)、または1つの体部位でのみ異常に豊富であると報告された属(「排他的」)の代表的な属が表示されている。b,34の異なる条件から抽出された糞便メタシグネチャーのクラスタリング。それぞれBugSigDBの少なくとも2つの研究によって表され、研究グループで存在量が増加した504のシグネチャーから生成された。クラスタリングは、がんの表現型(上)と非腫瘍性疾患(下)の分離を示している。糞便メタシグネチャー全体で、門別に色分けされた合計248の異なる属が観察された。各メタシグネチャーに含まれる属の数は、左の棒グラフに示されている。

フルサイズ画像
BugSigDBの少なくとも2つの研究によって研究され、研究グループにおいて相対的存在量が増加した504のシグネチャーから作成された34の異なる条件の糞便メタシグネチャーの体内部位クラスタリングにより、疾患表現型間で報告された存在量の差のパターンに類似性があることが明らかになった(図5b)。これには、(1)HIV感染とさまざまな消化管癌の微生物シフトの類似性が含まれ、両者とも消化管の慢性炎症を特徴とし、トリプトファン異化と酪酸合成を含む共通の病原経路を指し示す微生物シグネチャーがある79、 3)2型糖尿病と統合失調症:統合失調症患者は2型糖尿病のリスクが高く、逆に2型糖尿病の伝統的な危険因子が統合失調症患者では一般的であり、腸内細菌叢に影響を与えうるという観察結果、特に肥満、粗食、座りがちなライフスタイル84と一致している。橋本甲状腺炎(14属中12属、85.7%、P = 2.1×10-05、両側比例検定)と慢性疲労症候群(17属中11属、64.7%、P = 0.003)のメタシグニチャーの類似性は、Clostridia属に強く濃縮されていた。慢性疲労は、甲状腺ホルモンの産生を低下させ、極度の疲労を引き起こす可能性のある、腸内細菌叢主導型の甲状腺-腸軸85を介して潜在的に甲状腺に影響を与える疾患である橋本甲状腺炎患者において一般的である86。

特に、独立した研究によって再現されたもので、1つの病態でのみ存在量が異なると報告された属は、病態特異的バイオマーカーの候補である(補足図11、相対的サンプルサイズによる優先順位)。これは、大腸がんにおいてHungatella hathewayiが宿主の大腸上皮細胞のプロモーターでがん抑制遺伝子のハイパーメチル化を促進する役割が報告されていることから注目される87。しかしながら、2型糖尿病では、リラグルチドなどのグルカゴン様ペプチド-1受容体作動薬による治療によってマービンブリアンティアの減少が治療の成功に寄与することが示されている4。

考察
我々は、BugSigDBデータベースで微生物の存在量差のシグネチャーを公開し、微生物シグネチャーの濃縮解析のためのGSEA法の適用性を評価し、ヒトマイクロバイオーム文献の幅広いサンプルにわたる存在量差の結果に共通する共起と相互排除のパターンを同定した。BugSigDBはセマンティックMediaWikiであり、マイクロバイオーム研究コミュニティによる寄稿、レビュー、修正が可能で、ウェブインターフェースや、すべての主要なGSEAソフトウェアと互換性のあるバルクエクスポートを通じて使用できます。BugSigDBはNCBI Taxonomyに存在するあらゆる分類群、あらゆる宿主種をサポートしているため、ヒト以外の宿主やビローム、真核生物の研究も可能です。BugSigDBは当初、訓練された25名のキュレーターによって、600以上の主要出版物の図、表、本文、補足資料から2,500以上のシグネチャーが手動でキュレートされ、微生物の差異の存在量に関する機械可読な知識の広範な関連コレクションが提供されています。手動でキュレーションされたメタデータには、研究デザイン、地理、健康アウトカム、宿主体部位、実験・統計手法などが含まれる。このデータベースの初期解析により、(1)独自に発表された存在量の差のシグネチャーの中で最も一貫性の高いヒト疾患を同定し、(2)個々の参加者の大腸がんデータセットの解析において、大腸がんシグネチャーの優先順位付けを行う確立されたGSEA法の能力を実証し、口腔病原体の腸内への頻繁な侵入の証拠を追加した、 (3)対照集団の糞便中マイクロバイオームにおける属の有病率は、多様な研究条件下で減少したと報告されることと強い相関があることを実証する。(4)発表されたマイクロバイオーム文献における共起性と相互排他性の共通パターンを形成する上で、ファーミキューテス-バクテロイデーテス勾配の広範な関連性を確認し、他の支配的でないパターンを同定する。

複雑な実験や計算による定量化パイプラインには多くのばらつきの原因があるため、ヒトマイクロバイオーム研究の再現性には懸念がある88,89。我々は、16SアンプリコンシークエンシングとMGXのような異なる実験手法が用いられた場合でも、独立した研究によって報告された分類学的レベルの異なる存在量のシグネチャーの再現性を評価するために、システマティックレビューで使用できる意味類似性に基づいたアプローチを提案する。この分類学を意識した枠組みは、文献のサブセットに対するマイクロバイオームの存在量差シグニチャーの再現性を効果的に評価し、多くの疾患表現型にわたって異なる分類学的レベルで構成されるマイクロバイオームシグニチャーの相対的再現性のランキングを可能にする。その結果、独立した研究によって報告されたシグネチャーの中で、抗生物質治療や消化管の慢性炎症に関連するシグネチャーが、最も高いレベルの一貫性や再現性を持つことが確認された。

宿主の部位と実験条件にわたってシグネチャーをプールし、再現性の解析を、研究間で効果的に比較するには個体数が少なすぎる5分類群未満のシグネチャーの約45%にも拡大した。報告研究のサンプルサイズによって各分類群に重み付けをする投票法を用いて、コンセンサスとなる「メタシグネチャー」を構築し、疾患表現型別に腸内細菌異常症の共有パターンと特異的パターンを明らかにした。これらのメタシグネチャーは、発表された文献に照らし合わせて今後の研究結果の解釈を簡略化するための枠組みを提供し、特異的な結果と一般的な結果を区別し、目的の身体部位や状態について報告された存在量の変化のユニバースを定義することによって濃縮試験に情報を提供する。

単一生物種のバイオマーカーは治療的介入を行う上で主要な関心事であるが、健康や疾病に関連すると思われる微生物間の共存や相互排他性、相互作用などの複雑な生態学的パターンを捉えるには不十分である。BugSigDBで公開されているシグネチャーの検査は、個々の参加者のメタゲノムプロファイルにおける共起と共排除の分析を補完する、生態学的パターンを研究するための代替アプローチである。以前の結果54と一致するが、より大規模なマイクロバイオーム研究のコーパスにおいて、我々は、バクテロイデス門内の門レベルのファーミキューテス-バクテロイデス勾配や属レベルのバクテロイデス-プレボテラ勾配のような、疾患に特異的ではない共排他性を確認した。しかし、Clostridium属、Enterococcus属、Streptococcus属の相互排他性のパターンは、疾患関連シグネチャーに特異的であり、健康なサンプルでは検出できなかった。疾患マーカーとバイオマーカー探索における一般的な偽陽性を区別するために、我々は疾患状態の便シグネチャーと健常人からの〜10,000検体の便における有病率を比較した。BugSigDBに存在する多くの疾患や曝露において、健康な糞便微生物叢で有病な属は、疾患に関連した糞便微生物叢では存在量が減少する傾向が報告されている。一方、腸球菌(Enterococcus)のような健康な糞便微生物群の有病率が低い属は、疾患群では存在量が増加して報告される傾向がある。LactobacillusやVeillonellaのような属は、健康な人の便に広く存在し、多くの研究条件下で頻繁に増加することが報告されているが、偽陽性の可能性が高いか、少なくともバイオマーカー候補としてはあまり適していない。将来的には、実験的、横断的、縦断的研究デザインによるBugSigDBシグネチャーの層別化を用いて、より良い因果関係を推論することができます。

BugSigDBは、新しいマイクロバイオーム研究から得られた微生物シグネチャーを、過去に発表された結果と系統的に比較することを可能にします。GSEAの概念は適用可能であるが、マイクロバイオームデータには、シグネチャーサイズの小ささ、特徴間の分類学的関係、混合分類のシグネチャーなど、新たな課題がある。そこで、過去のベンチマーク7で良好な結果を得た2つの遺伝子セット濃縮法(ORA11とPADOG31)と、マイクロバイオームデータ専用に開発された最新の分類学的濃縮法(CBEA18)をベンチマークした。遺伝子セット濃縮法の有効な適用は単一の分類学的レベルでの解析に限定され、ORA はさらに現実的な特徴の「ユニバース」と存在量の差の有意閾値を定義する必要がある。それにもかかわらず、すべての手法は、多数の大腸がんデータセットにわたって大腸がんのシグネチャーの優先順位付けにおいて良好な結果を示した。PADOGは、(1)微生物間の相関がある場合のORAの欠点、および(2)技術的または生物学的なサンプリングバイアス67,90の典型的な結果として、特定の分類群が他の分類群よりも多く出現するシグネチャーデータベースにおける組成の偏りの両方に対処しているため、微生物シグネチャーへの濃縮解析の日常的な適用には、ORAよりもPADOGを推奨する。CBEA18のような最近登場したマイクロバイオーム特異的エンリッチメント法は、マイクロバイオームデータの組成的性質を考慮に入れるという利点があるが、主要なGSEAアプローチの独立したベンチマークと実装に欠けている。我々は、CBEAがORAやPADOGの健全な代替法であることを見出したが、大腸癌のベンチマークセットアップにおいて、PADOGよりもCBEAを適用することによる顕著な利益は観察されなかった。これは、サンプルサイズなどの基本的な研究特性や、微生物シグネチャー内の相関性の考慮が、組成性の影響を緩和するよりも、実際の関連シグネチャーの同定に大きな影響を与えることを示している。

BugSigDBは、現在利用可能な微生物存在量の差に関する文献の大規模かつ多様なコレクションであるため、現在利用可能な文献に固有の一定の制限もある。BugSigDBの最初のリリースに含まれる研究の90%以上が16Sアンプリコンシーケンスに基づいているため、濃縮解析は属レベルで行われた。しかし、連鎖球菌のように、致命的な病原体と一般的な常在菌や有用な食品発酵種をグループ化するような、機能的に不均一な属もある。種や菌株レベルの変異は、臨床的に重要な個体間の機能的差異に寄与する可能性があるにもかかわらず、無視されている91,92。今後、より多くのショットガンシークエンシング研究が利用可能になれば、種や菌株レベルまで、より高い分類学的解像度で濃縮解析を行うことが可能になるだろう。さらに、BugSigDBに含まれる研究は、現在使用中の抗生物質から過去1年以内の抗生物質排除期間を含む、そのデザインと実行において不均一である。抗生物質投与後のベースラインの微生物組成の回復には、一般的に小児では約1ヶ月、成人では1.5ヶ月かかるが、腸内細菌叢のいくつかの一般的な種ではそれ以上かかる可能性がある50,93。BugSigDBにこのような研究情報やその他の研究情報を含めることで、文献中の異質性の潜在的な原因についてさらなる調査や感度分析が可能になる。最近開発されたヒトマイクロバイオーム研究のためのSTORMS報告ガイドライン94がより広範に採用されることで、BugSigDBのための文献からの情報抽出がより効率的に行われることが期待される。

自然言語解析プログラムはBugSigDBで手作業でキュレーションされた情報を補完する可能性があるが、キュレーションされた情報の大部分は現在利用可能なテキストマイニングアルゴリズムには複雑すぎる。自然言語解析プログラムは通常、構造化されていないテキストから文単位でパターンを抽出するが95,96、BugSigDBは微生物シグネチャーと関連する実験的、疫学的、統計的手法を、多様な図、表、補足、複数の文にまたがることが多いテキスト記述から標準化している。しかし、BugSigDBをゴールドスタンダードデータセットとした機械学習の改善により、将来的には発表されたマイクロバイオームの手法や結果をより効率的に抽出できるようになるかもしれない。さらに、BugSigDBアプリケーションプログラミングインターフェースを介して、アバンダンス差ソフトウェアからシグネチャを自動投稿することで、標準化された結果報告を効率化することができる。BugSigDBは、コミュニティから宿主種や微生物の生理・形態に関するシグネチャーが追加投稿されるにつれて、ダイナミックに拡張され、マイクロバイオーム研究の系統的解釈に対する補完的な洞察や改善につながるだろう。

方法
意味概念(研究、実験、シグネチャー、分類群)の定義
分類群
分類単位(taxon)とは、微生物生物または微生物生物群を示す任意のランク(すなわち、王国、門、綱、目、科、属、種、株)の単位である。

シグネチャー
微生物シグネチャーまたはセットとは、ある研究条件に対する共通の性質や反応を共有する微生物群(分類群)の単純で順序のないリストを指す。

実験
BugSigDBでは、実験を研究内の意味的単位として定義し、研究対象、ラボ解析、統計解析、α多様性に関する主要な特徴を記録しています。研究対象については、宿主種、場所、状態、身体部位、抗生物質の排除、研究サンプル群と対照サンプル群のサンプルサイズなどが含まれる。BugSigDBは、存在量の差について対比される2つのサンプル群を定義するために、研究群で代表される特定の状態/表現型を定義するために適用された診断基準を記録します。記録されるラボ解析フィールドには、シーケンスタイプ(16SまたはMGX)およびシーケンスプラットフォーム(IlluminaまたはRoche454など)が含まれます。16S rRNAシーケンスでは、16S可変領域も記録される。統計解析については、(1)有意差検定に適用した統計学的検定または計算ツール、(2)偽陽性所見の氾濫を調整するために多重検定補正を適用したかどうか、(3)分類群を有意差ありとするために使用した有意閾値、(4)層別化またはモデル調整によって説明された交絡因子、(5)症例対照研究において研究対象者がマッチングされた因子(該当する場合)などが記録されている。

研究
BugSigDBは公表されている16SおよびMGXマイクロバイオーム研究から微生物シグネチャーを収集し、標準化しています。研究は研究デザインごとに分類され、各研究はPubMed IDやDOIなどの研究識別子と関連付けられている。

データ入力、検証、アクセス
BugSigDBはセマンティックMediaWiki30として実装されており、https://bugsigdb.org、データ入力、セマンティック検証、研究、実験、シグネチャー、個々の分類群に対する注釈へのウェブベースのプログラムアクセスをサポートしている。セマンティックWikiは、(1)NCBI Taxonomy Database29の命名法に従ったデータ入力を強制し、(2)身体部位28、病状32、エビデンスのタイプについて、確立されたオントロジーと統制された語彙に従ったシグネチャーのメタデータ注釈を強制し、(3)分類学とメタデータの属性で潜在的にフィルタリングされた、すべてのシグネチャーにアクセスするためのアプリケーションプログラミングインターフェースを提供し、(4)データ要素と関連についてのコメントとエラー報告を可能にする。データキュレーションインターフェースは、シグネチャーの整理、フィルタリング、比較を容易にするため、有効なデータ入力を支援するタイプフォワードオートコンプリート(NCBI分類学29、Experimental Factor Ontology32、UBERON Anatomy Ontology28、および統計的試験法や配列決定法などの他の分野に対する管理者定義の統制語彙に対する検証を含む)を提供する。署名、注釈、コメントを含むコミュニティからの外部投稿は、ウィキペディアと同様にサポートされている。寄稿の質は、信頼できる編集者によるレビュー後に検証済みとしてタグ付けされ、疑わしいエントリーにフラグを立てる方法や、未レビューの寄稿や、サンプルサイズ、汚染の疑い、論文撤回、バッチ効果、非制御交絡、またはこれらの要因の組み合わせなどの研究の質の要素に基づいて解析から除外するオプションによって制御される。研究レベルでの標準的なセマンティックMediaWiki品質管理タグに加え、頻繁に調査される宿主の体部位での有病率、公表されている汚染ブラックリスト114,115への包含、宿主との既知の関連がないことに従って分類群にフラグを立てるためのカスタムメソッドが利用可能です。

シグネチャーは、研究および実験の属性、および個々の分類群ごとに、https://bugsigdb.org で検索および閲覧することができる。全シグネチャーと関連メタデータの一括エクスポートは、現在のデータベースバージョン、または週ごとや半期ごとのスナップショットとして、任意のプログラミング言語やソフトウェア(.csvやGeneSigDB23やMSigDB21で使用されている.gmt標準を含む)で使用できるプレーンテキスト形式で利用できる。付属のbugsigdbr R/Bioconductorパッケージ(bioconductor.org/packages/bugsigdbr)は、オントロジーベースのフィルタリング、分類学的レベルの制限、個々のシグネチャーやタクソンページのルックアップ、アプリケーション中心のフォーマットへの変換などの高度な機能を提供する。エクスポートされたファイルはほとんどのエンリッチメントソフトウェアと互換性があり、私たちの研究室のEnrichmentBrowser R/Bioconductorパッケージ55にデフォルトで含まれており、多くのGSEAメソッドや可視化を容易にしている。BugSigDBStats Rパッケージは、https://bugsigdb.org と継続的に統合され、毎週更新されるデータベースの統計情報をHTMLレポートページで提供している(https://waldronlab.io/BugSigDBStats)。

シグネチャ類似度
シグネチャの類似度は2つの異なる尺度に基づいて計算された: (1)属レベルで調和されたシグネチャ間のペアワイズ重複に基づくJaccard指数と、(2)混合分類レベルのシグネチャ間の意味的類似性。BugSigDBStatsパッケージのcalcJaccardSimilarity関数を用いて、属レベルのシグネチャのJaccard類似度のペアワイズ計算を行った。BugSigDBの属レベルのシグネチャーはbugsigdbrのgetSignatures関数を用いて取得した。より具体的な分類学的レベル(種または系統)で与えられた分類学的クレードは、属レベルで分類木を切断することで変換した。Jaccard指数は、Jaccard類似度係数としても知られ、2つの入力シグネチャーAとBの和のサイズで割った交点のサイズとして定義される:

$$J(A,B)=\frac{{\rm{|}}A\cap B{\rm{|}}}{\left|A\cup B\right|}$$
(1)
設計上、0 ≤ J(A, B) ≤ 1 であることに注意。

意味的類似度は、ontologyX Rパッケージシリーズ117のontologySimilarityパッケージで実装されているLinの意味的類似度の尺度116に基づいて計算された。意味的類似性の尺度は、分類学118 内の概念を比較するために提案されており、生物医学オントロジーに数多くの応用例がある36。特に、意味的類似度は、UniFrac 距離119 の計算と概念的に類似している。ここで、個々の分類群は、有向非循環グラフとして表現されるとき、NCBI分類群のノードとみなすことができる。2つの分類群間の意味的類似性を計算することは、2つの分類群ノードを結ぶ最短パスのような位相的類似性を計算することに相当します。より具体的には、2つの分類群間の意味的類似性のLinの尺度を計算することは、2つの分類群の最小公倍数祖先(LCA)の情報量を計算することに相当します116。ある分類群の出現頻度が高ければ高いほど(つまり、その分類群の他の分類群の祖先である確率が高ければ高いほど)、その情報量は低くなります。2つの分類群のLCAがより高い分類レベルにある分類群に対応する場合、これらの分類群はあまり類似しておらず、これはLCAの情報量が低いことに反映されます。個々の分類群間の一対の意味的類似性が与えられた場合、2つのシグネチャー(つまり2つの分類群セット)間の意味的類似性は、ベストマッチ平均組み合わせアプローチ120を使用して取得されます。

バグセット濃縮解析
大腸がん患者および健常人の糞便微生物群の種レベルの相対存在量を提供するメタゲノミックデータセットは、curatedMetagenomicData 3.0(文献54)から入手した。相対存在量の割合にリードの深さを掛け合わせ、最も近い整数に丸めた後、差分発現解析およびGSEA用のバルクRNAシーケンス(RNA-seq)ツールに適合する整数のリードカウントを得た。属レベルの解析では、miaパッケージのsplitByRanks関数を用いて、ブランチ間で種レベルのカウントを合計した。マイクロバイオームデータに対するバルクRNA-seqツールの良好なパフォーマンスを報告した最近の評価121を考慮し、limma-trendアプローチ122に従って差分存在量解析を行った。リードカウントは、低いカウントの対数の分散を減衰させるため、事前カウントを3としてedgeRのcpm関数を用いて対数(counts per million)に変換した123。BugSigDBからの属および種レベルの微生物シグネチャーは、bugsigdbrのgetSignatures関数を用いて取得した。シグネチャーを意味のあるサイズに保つため、種または菌株レベルで与えられた分類学的クレードは、属レベルで分類学的ツリーを切断することで変換した。ORAとPADOGはEnrichmentBrowserパッケージ55で実装されているように実行した。CBEAはCBEAパッケージ18で実装されているように実行した。

分類群の共起
BugSigDBから属レベルのシグネチャーをbugsigdbrパッケージのgetSignatures関数を用いて取得した。シグネチャーは糞便サンプルの体の部位でフィルタリングし、存在量の変化の方向(増加/減少)で層別化した。得られたシグネチャーのうち、出現頻度の高い上位20属を報告した。これらの属の有病率は、curatedMetagenomicData 3.0(文献123)のメタゲノミックデータセットにおいて、その属の相対存在量がゼロでない状態で観察された健康な成人の便サンプルの割合として計算した。statsパッケージのcor.test関数に実装されているピアソンの相関検定を用いて、健康なサンプルにおける有病率と、上位20属の存在量が増加したシグネチャーの割合との相関を評価した。疾患に関連するシグネチャーにおける分類群の共起を、statsパッケージのcor関数を用いて、健常サンプルの上位20属のスピアマン順位相関と対比した。

シグネチャーのプール
bugsigdbrパッケージのgetMetaSignatures関数で実装されているように、一度に1つの身体部位について、また一度に1つの条件について身体部位内でシグネチャーをプールした。プールされたシグネチャー内の分類群は、この分類群が有意に豊富であると報告した研究のサンプルサイズを、プールされたシグネチャーに寄与した研究のサンプルサイズ合計で割った値に基づいて重み付けされた。BugSigDBStatsパッケージのweightedBMA関数で実装されているように、重み付けされたメタシグネチャーは意味的類似性によってクラスタ化され、重みはベストマッチ平均組み合わせアプローチ36に組み込まれた。解析は、BugSigDBで少なくとも2つの研究によって研究され、結果としてプールされたシグネチャーに少なくとも5つの分類群を含む身体部位と条件に限定した。クラスタリングの頑健性は順位バイアスのオーバーラップと比較することで評価した124。

報告概要
研究デザインに関する詳細は、本論文にリンクされているNature Portfolio Reporting Summaryを参照されたい。

データの利用可能性
BugSigDBは、https://bugsigdb.org/Project:About に記載されているオープンソースおよびオープンデータライセンスのもと、Semantic MediaWikiのウェブインターフェース(https://bugsigdb.org)を介して利用可能である。週次および半期ごとのスナップショットは、言語間およびアプリケーション間の互換性のため、https://github.com/waldronlab/BugSigDBExports でプレーンテキストファイル形式で提供されています。未処理のスナップショットは、https://bugsigdb.org/Help:Export で .csv ファイルとして提供されています。付属のbugsigdbr R/Bioconductorパッケージは、オントロジー対応およびタクソノミー対応機能を含む高度なデータ操作を提供する(https://bioconductor.org/packages/bugsigdbr)。NCBI Taxonomyデータベースはhttps://www.ncbi.nlm.nih.gov/taxonomy。Experimental Factor Ontologyはhttps://www.ebi.ac.uk/efo。UBERON Anatomy Ontologyはhttps://www.ebi.ac.uk/ols/ontologies/uberon。

コードの利用可能性
ソースコードとオープンイシュートラッキングは、https://github.com/waldronlab/BugSigDB。統計解析はR125とBioconductor126を使用し、GitHub127で提供されているコードを使用して再現可能である。

参考文献
アテローム性動脈硬化症における腸内細菌叢の役割。Nat. Rev. Cardiol. 14, 79-87 (2017).

CAS

PubMed

Google Scholar

Tang, W. H. W., Kitai, T. & Hazen, S. L. 心血管系の健康と疾患における腸内細菌叢。Circ. Res. 120, 1183-1196 (2017).

CAS

PubMed

パブメドセントラル

Google Scholar

シュワーベ、R. F. & ジョビン、C. マイクロバイオームとがん。Nat. Rev. Cancer 13, 800-812 (2013).

CAS

PubMed

パブメドセントラル

Google Scholar

2型糖尿病の病態生理における腸内細菌叢の役割。EBioMedicine 51, 102590 (2020).

PubMed

PubMed Central

Google Scholar

Paulson、J.N.、Stine、O.C.、Bravo、H.C.、Pop、M. 微生物マーカー遺伝子調査のための存在量差解析。Nat. Methods 10, 1200-1202 (2013).

CAS

PubMed

パブメドセントラル

グーグル

遺伝子セット濃縮解析:ゲノムワイド発現プロファイルを解釈するための知識ベースのアプローチ。Proc.。Natl Acad. USA 102, 15545-15550 (2005).

遺伝子発現

医学・薬学

パブメドセントラル

Google Scholar

Geistlinger、L. et al. 遺伝子セット濃縮解析のベンチマーク用ゴールドスタンダードへ向けて。Brief. Bioinform. 22, 545-556 (2020).

PubMed Central

Google Scholar

Huang, D. W., Sherman, B. T. & Lempicki, R. A. Bioinformatics enrichment tools: paths towards the comprehensive functional analysis of large gene lists. Nucleic Acids Res. 37, 1-13 (2009).

PubMed

Google Scholar

遺伝子発現を網羅的に解析するためのツール。Bioinformatics 27, i366-i373 (2011).

CAS

PubMed

PubMedセントラル

Google Scholar

遺伝子発現データからGOグラフ構造を装飾することにより機能グループのスコアリングを改善した。Bioinformatics 22, 1600-1607 (2006).

CAS

PubMed

Google Scholar

遺伝子発現データを遺伝子セットの観点から解析する:方法論的問題点。バイオインフォマティクス 23, 980-987 (2007).

CAS

PubMed

Google Scholar

遺伝子発現データを遺伝子セットで解析する。Nat. Biotechnol. 28, 495-501 (2010).

CAS

PubMed

パブメドセントラル

Google Scholar

Chagoyen, M., López-Ibáñez, J. & Pazos, F. メタボロミクスデータの機能解析。Methods Mol. Biol. 1415, 399-406 (2016).

CAS

PubMed

Google Scholar

Ried、J. S. et al. PSEA: phenotype set enrichment analysis- a new method for analysis of multiple phenotypes. Genet. Epidemiol. 36, 244-252 (2012).

PubMed

Google Scholar

MicroPattern: a web-based tool for microbe set enrichment analysis and disease similarity calculation based on a list of microbes. Sci. Rep. 7, 40200 (2017).

CAS

PubMed

PubMedセントラル

Google Scholar

Dhariwal, A. et al. MicrobiomeAnalyst: a web-based tool for comprehensive statistical, visual and meta-analysis of microbiome data. Nucleic Acids Res. 45, W180-W188 (2017).

CAS

PubMed

PubMedセントラル

Google Scholar

Kou, Y., Xu, X., Zhu, Z., Dai, L. & Tan, Y. Microbe-set濃縮解析はマイクロバイオームプロファイリングデータの機能的解釈を容易にする。Sci. Rep. 10, 21466 (2020).

CAS

PubMed

パブメドセントラル

Google Scholar

Nguyen, Q. P., Hoen, A. G. & Frost, H. R. CBEA: 分類学的濃縮解析のための競合バランス. PLoS Comput. Biol. 18, e1010091 (2022).

CAS

PubMed

パブメドセントラル

Google Scholar

遺伝子オントロジー:生物学統一のためのツール。遺伝子オントロジー・コンソーシアム。Nat. Genet. 25, 25-29 (2000).

CAS

PubMed

パブメドセントラル

Google Scholar

KEGG: Kyoto Encyclopedia of Genes and Genomes. Nucleic Acids Res. 28, 27-30 (2000).

CAS

PubMed

パブメドセントラル

Google Scholar

Liberzon, A. et al. 分子シグネチャーデータベース(MSigDB)3.0. バイオインフォマティクス 27, 1739-1740 (2011).

CAS

PubMed

PubMedセントラル

Google Scholar

遺伝子発現を調べるためのデータベース。Cell Syst. 1, 417-425 (2015).

CAS

PubMed

PubMedセントラル

Google Scholar

Culhane, A. C. et al. GeneSigDB: A manual curated database and resource for analysis of gene expression signatures. 遺伝子発現シグネチャーを解析するためのデータベース。

CAS

PubMed

Google Scholar

遺伝子発現シグネチャーを解析するためのデータベース。Nucleic Acids Res. 45, D535-D542 (2017).

CAS

PubMed

Google Scholar

Shaaban, H. et al. Microbe Directory: an annotated, searchable inventory of microbes' characteristics. Gates Open Res. 2, 3 (2018).

PubMed

パブメドセントラル

Google Scholar

ベルジー, D. H. & ホルト J. G. ベルジー体系細菌学マニュアル, 第1巻 (ウィリアムズ & ウィルキンス, 1984).

Reimer, L. C. et al. BacDive in 2022: The knowledge base for standardized bacterial and archaeal data. Nucleic Acids Res. 50, D741-D746 (2022).

CAS

PubMed

Google Scholar

ゲノム生物学(Genome Biol. ゲノム生物学 13, R5 (2012).

ゲノム生物学

パブメドセントラル

Google Scholar

NCBI分類データベース. Nucleic Acids Res. 40, D136-D143 (2012).

CAS

PubMed

Google Scholar

(1)萌え萌え萌え萌え! この論文では、セマンティック・メディアウィキを利用した、セマンティック・メディアウィキの開発について解説している。

遺伝子の重なりを減らすと遺伝子セット解析が向上する。遺伝子セット解析に有用。

PubMed

パブメドセントラル

Google Scholar

実験因子オントロジーを用いたサンプル変数のモデル化。Bioinformatics 26, 1112-1118 (2010).

CAS

PubMed

PubMedセントラル

Google Scholar

メタゲノムバイオマーカーの発見とその解説。ゲノム生物学 12, R60 (2011).

PubMed

PubMed Central

Google Scholar

Gloor、G. B.、Macklaim、J. M.、Pawlowsky-Glahn、V. & Egozcue、J. J. Microbiome datasets are compositional: and this is not optional. Front. Microbiol. 8, 2224 (2017).

PubMed

PubMed Central

Google Scholar

Chung, N. C., Miasojedow, B., Startek, M. & Gambin, A. Jaccard/Tanimoto similarity test and estimation methods for biological presence-absence data. BMC Bioinformatics 20, 644 (2019).

PubMed

パブメドセントラル

グーグル・スカラー

生物医学オントロジーにおける意味的類似性。PLoS Comput. 5, e1000443 (2009).

PubMed

PubMedセントラル

Google Scholar

アンピシリンとゲンタマイシンによる非経口抗生物質治療後の乳児腸内細菌叢の不完全で短期的な回復を明らかにした。Antimicrob. Agents Chemother. 56, 5811-5820 (2012).

CAS

PubMed

パブメドセントラル

Google Scholar

O'Sullivan、O.ら、抗生物質治療後のアイルランド人高齢者の腸内細菌叢の変化。J. Antimicrob. Chemother. 68, 214-221 (2013).

Arat, S. et al. 細菌ペプチドデホルミラーゼを標的とする新規抗生物質GSK1322322を投与した健常ボランティアにおけるマイクロバイオームの変化。Antimicrob. Agents Chemother. 59, 1182-1192 (2015).

PubMed

PubMed Central

Google Scholar

de Gunzburg, J. et al. 抗生物質からのヒト腸内細菌叢の保護。J. Infect. Dis. 217, 628-636 (2018).

Zou, Z.-H. et al. 出生前および出生後の抗生物質曝露は、新生児集中治療室における早産児の腸内細菌叢に影響を及ぼす。Ann. Clin. Microbiol. Antimicrob. 17, 9 (2018).

PubMed

PubMed Central

Google Scholar

Zhang、M.ら:出生前の抗生物質と乳児の脂肪率および腸内細菌叢の指標との関連。Ann. Clin. Microbiol. Antimicrob. 18, 18 (2019).

PubMed

パブメドセントラル

Google Scholar

Coker, M. O. et al.分娩内抗生物質の特定クラスと乳児腸内細菌叢の成熟との関連:前向きコホート研究。BJOG 127, 217-227 (2020).

CAS

PubMed

Google Scholar

HIV感染は直腸粘膜微生物叢の組成的・機能的シフトと関連している。Microbiome 1, 26 (2013).

PubMed

PubMed中央

Google Scholar

HIV-1感染者の糞便微生物叢の変化:中国人集団における観察研究。Sci. Rep. 6, 30673 (2016).

CAS

PubMed

パブメドセントラル

Google Scholar

後天性免疫不全症候群患者の腸内細菌叢の変化。J. Cell. Mol. Med. 22, 2263-2271 (2018).

CAS

PubMed

パブメドセントラル

Google Scholar

Kaur, U. S. et al. 周産期HIV感染児の腸内におけるプレボテラ属の高い存在量は、治療にもかかわらずIP-10レベルと関連している。Sci. Rep. 8, 17679 (2018).

PubMed

PubMed Central

Google Scholar

Sainz, T. et al. 垂直HIV感染児の腸内細菌叢に対する栄養介入の効果: ペディアビオタ研究。Nutrients 12, 2112 (2020).

CAS

PubMed

パブメドセントラル

Google Scholar

Rashid,M.-U.ら:培養およびパイロシークエンシング法を用いた抗生物質投与がヒト正常腸内細菌叢に及ぼす長期的影響の検討。Clin. Infect. Dis. https://doi.org/10.1093/cid/civ137 (2015).

Ramirez, J. et al. Antibiotics as major disruptors of gut microbiota. Front. Cell. Infect. Microbiol. 10, 572912 (2020).

Alzahrani, J. et al. Inflammatory and immunometabolic consequences of gut dysfunction in HIV: parallels with IBD and implications for reservoir persistence and non-AIDS comorbidities. EBioMedicine 46, 522-531 (2019).

PubMed

パブメドセントラル

Google Scholar

Faiela, C. & Sevene, E. MozambiqueのプライマリーヘルスケアにおけるHIV陽性患者への抗生物質処方:横断研究。S. Afr. J. Infect. Dis. 37, 340 (2022).

PubMed

パブメドセントラル

グーグル奨学生

Szychowiak, P., Villageois-Tran, K., Patrier, J., Timsit, J.-F. & Ruppé, É. 集中治療患者の管理における微生物叢の役割。Ann. Intensive Care 12, 3 (2022).

CAS

PubMed

パブメドセントラル

Google Scholar

Pasolli, E. et al. ExperimentHubによるメタゲノム解析データの公開。Nat. Methods 14, 1023-1024 (2017).

CAS

PubMed

PubMedセントラル

Google Scholar

Bioconductor's EnrichmentBrowser: set-basedとnetwork-basedの濃縮解析結果を組み合わせたシームレスなナビゲーション。BMC Bioinformatics 17, 45 (2016).

PubMed

PubMedセントラル

Google Scholar

Thomas, A. M. et al.大腸がんデータセットのメタゲノム解析により、クロスコホート微生物診断シグネチャーとコリン分解との関連が同定された。Nat. Med. 25, 667-678 (2019).

CAS

PubMed

パブメドセントラル

Google Scholar

Wirbel, J. et al.糞便メタゲノム解析により、大腸がんに特異的なグローバルな微生物シグネチャーが明らかになった。Nat. Med. 25, 679-689 (2019).

CAS

PubMed

パブメドセントラル

Google Scholar

Wu, N. et al.大腸癌患者における糞便微生物叢のディスバイオシス・シグネチャー。Microb. Ecol. 66, 462-470 (2013).

CAS

PubMed

Google Scholar

モロッコの大腸癌患者の腸内細菌叢。Med. Microbiol. Immunol. 207, 211-225 (2018).

CAS

PubMed

パブメドセントラル

Google Scholar

Koliarakis, I. et al.大腸癌における口腔内細菌と腸内細菌異常症。Int. J. Mol. Sci. 20, 4146 (2019).

PubMed

パブメドセントラル

グーグル奨学生

Irfan, M., Delgado, R. Z. R. & Frias-Lopez, J. The oral microbiome and cancer. Front. Immunol. 11, 591088 (2020).

CAS

PubMed

パブメドセントラル

Google Scholar

歯周病、歯の喪失と鋸歯状ポリープおよび従来の腺腫のリスク。Cancer Prev. Res. 13, 699-706 (2020).

Google Scholar

Camera: a competitive gene set test accounting for inter-gene correlation. Nucleic Acids Res. 40, e133 (2012).

CAS

PubMed

PubMedセントラル

Google Scholar

GO用語の関連性を調べるために遺伝子リストをテストするためのGOstatsの使用。Bioinformatics 23, 257-258 (2007).

CAS

PubMed

Google Scholar

遺伝子セット解析法の感度、優先順位、特異性の比較。PLoS ONE 8, e79217 (2013).

PubMed

パブメドセントラル

Google Scholar

遺伝子発現を解析した結果、遺伝子発現に有意な影響を与えるパスウェイを同定した。Genome Biol. 20, 203 (2019).

PubMed

パブメドセントラル

グーグル・スカラー

McLaren, M. R., Willis, A. D. & Callahan, B. J. メタゲノム配列決定実験における一貫した修正可能なバイアス。

ヒトマイクロバイオームプロジェクトコンソーシアム。健康なヒトのマイクロバイオームの構造、機能、多様性。Nature 486, 207-214 (2012).

PubMed Central

Google Scholar

Qin, J. et al. メタゲノムシークエンシングによって確立されたヒト腸内細菌遺伝子カタログ。Nature 464, 59-65 (2010).

CAS

PubMed

パブメドセントラル

Google Scholar

Falony, G. et al.腸内細菌叢変異の集団レベル解析。Science 352, 560-564 (2016).

CAS

PubMed

Google Scholar

Costea, P. I. et al. 腸内微生物群集組成のランドスケープにおける腸内タイプ。Nat. Microbiol. 3, 8-16 (2017).

PubMed

PubMed Central

Google Scholar

Krzyściak, W., Pluskwa, K. K., Jurczak, A. & Kościelniak, D. Streptococcus属の病原性。Eur. J. Clin. Microbiol. Infect. Dis. 32, 1361-1376 (2013).

PubMed

パブメドセントラル

Google Scholar

腸球菌の病原性。Microbiol. Spectr. https://doi.org/10.1128/microbiolspec.GPP3-0053-2018 (2019).

Harty, D. W., Oakey, H. J., Patrikakis, M., Hume, E. B. & Knox, K. W. Pathogenic potential of lactobacilli. Int. J. Food Microbiol. 24, 179-189 (1994).

CAS

PubMed

Google Scholar

Elsevier's Integrated Review Immunology and Microbiology (Elsevier Health Sciences, 2011).

Nie,K.ほか. Roseburia intestinalis: a beneficial gut organism from the discoveries in genus and species. Front. Cell. Infect. Microbiol. 11, 757718 (2021).

CAS

PubMed

パブメドセントラル

Google Scholar

パーカー、B.J.、Wearsch、P.A.、Veloo、A.C.M.&ロドリゲス-パラシオス、A.アリスティペス属:炎症、がん、メンタルヘルスに新たな意味を持つ腸内細菌。フロント。Immunol. 11, 906 (2020).

CAS

PubMed

パブメドセントラル

Google Scholar

ヒトマイクロバイオームにおける微生物の共起関係。PLoS Comput. Biol. 8, e1002606 (2012).

CAS

PubMed

パブメドセントラル

Google Scholar

HIV、癌、微生物叢:異なる疾患に影響を及ぼす共通の経路。Front. Immunol. 10, 1466 (2019).

CAS

PubMed

パブメドセントラル

Google Scholar

Caubit, X. et al. TSHZ3欠損は自閉症症候群を引き起こし、大脳皮質投射ニューロンの欠損を引き起こす。Nat. Genet. 48, 1359-1369 (2016).

CAS

PubMed

パブメドセントラル

Google Scholar

コピー数異常は先天性腎奇形の一般的な原因である。Am. J. Hum. Genet. 91, 987-997 (2012).

CAS

PubMed

パブメドセントラル

Google Scholar

Peralta-Marzal, L. N. et al. 自閉症スペクトラム障害における腸内細菌叢由来代謝産物の影響。Int. J. Mol. Sci. 22, 10052 (2021).

CAS

PubMed

パブメドセントラル

Google Scholar

Clothier, J. & Absoud, M. 自閉症スペクトラム障害と腎臓病。Pediatr. Nephrol. 36, 2987-2995 (2021).

PubMed

グーグル奨学生

Suvisaari, J., Keinänen, J., Eskelinen, S. & Mantere, O. 糖尿病と統合失調症。Curr. Diab. Rep. 16, 16 (2016).

PubMed

グーグル奨学生

Knezevic, J., Starchl, C., Tmava Berisha, A. & Amrein, K. 甲状腺-腸-軸:微生物叢は甲状腺機能にどのように影響するか?Nutrients 12, 1769 (2020).

CAS

PubMed

パブメドセントラル

Google Scholar

Ruiz-Núñez, B., Tarasse, R., Vogelaar, E. F., Janneke Dijck-Brouwer, D. A. & Muskiet, F. A. J. 慢性疲労症候群患者における「低T3症候群」の高い有病率:症例対照研究。Front. Endocrinol. 9, 97 (2018).

Google Scholar

Xia, X. et al. 細菌病原体は、大腸がんにおける腫瘍抑制遺伝子の宿主大腸上皮細胞プロモーター過剰メチル化を促進する。Microbiome 8, 108 (2020).

CAS

PubMed

パブメドセントラル

Google Scholar

マイクロバイオーム品質管理プロジェクト:ベースライン研究デザインと今後の方向性。ゲノム生物学 16, 276 (2015).

PubMed

パブメドセントラル

Google Scholar

微生物ゲノム研究における再現性、複製性、頑健性、一般化可能性に対する脅威の特定と克服。

PubMed

PubMedセントラル

Google Scholar

Quince、C., Walker、A. W., Simpson、J. T., Loman、N. J. & Segata、N. Shotgun metagenomics, from sampling to analysis. Nat. Biotechnol. 35, 833-844 (2017).

CAS

PubMed

Google Scholar

Schloissnig, S. et al. ヒト腸内細菌叢のゲノム変異ランドスケープ。Nature 493, 45-50 (2013).

PubMed

Google Scholar

ヒト腸内細菌種の遺伝子含有量における個人差。ゲノム生物学 16, 82 (2015).

PubMed

パブメドセントラル

Google Scholar

McDonnell,L.ら:小児における抗生物質と腸内細菌叢異常の関連:系統的レビューとメタ解析。Gut Microbes 13, 1-18 (2021).

PubMed

Google Scholar

ヒトマイクロバイオーム研究の報告ガイドライン:STORMSチェックリスト。Nat. Med. 27, 1885-1892 (2021).

CAS

PubMed

パブメドセントラル

Google Scholar

BioBERT:生物医学テキストマイニングのための事前学習済み生物医学言語表現モデル。Bioinformatics 36, 1234-1240 (2020).

CAS

PubMed

Google Scholar

COVID-19に関する急速に拡大する文献を扱うためのテキストマイニングアプローチ。Brief. Bioinform. 22, 781-799 (2021).

PubMed

Google Scholar

Cook, R. R. et al. 男性と性交渉を持つ若い男性の覚醒剤使用に関連する消化管マイクロバイオームの変化。Sci. Rep. https://doi.org/10.1038/s41598-019-51142-8 (2019).

Tsementzi, D. et al.放射線療法前後の婦人科がん患者と健常女性における膣内細菌叢の比較。Cancer Med. https://doi.org/10.1002/cam4.3027 (2020).

COVID-19におけるヒト口腔および腸内細菌叢の変化とリピドミクス。Gut 70, 1253-1265 (2021).

CAS

PubMed

Google Scholar

Gong, H. et al. 喉の微生物叢と喉頭癌の危険因子。Appl. Environ. Microbiol. https://doi.org/10.1128/AEM.02329-14 (2014).

Yang、C.-Y.ら、口腔扁平上皮がんの病期分類に関連する口腔微生物叢のコミュニティダイナミクス。Front. Microbiol. https://doi.org/10.3389/fmicb.2018.00862 (2018).

Correa, J. D. et al. Oral microbial dysbiosis linked to worsened periodontal condition in rheumatoid arthritis patients. Sci. Rep. 9, 8379 (2019).

PubMed

パブメドセントラル

Google Scholar

Sato, N. et al.東アジアの集団における喫煙と舌のマイクロバイオームの関係。J. Oral Microbiol. https://doi.org/10.1080/20002297.2020.1742527 (2020).

同種造血幹細胞移植当日の舌微生物叢の乱れと非土着菌の検出。PLoS Pathog. https://doi.org/10.1371/journal.ppat.1008348 (2020).

Balan, P. et al. 健康な妊娠中および妊娠性歯肉炎における歯肉縁下細菌叢。JDR Clin. Trans. Res. https://doi.org/10.1177/2380084420948779 (2021).

Coit, P. et al. 16S rRNAの塩基配列決定により、ベーチェット病における唾液マイクロバイオームの特徴が明らかになった。Clin. Immunol. https://doi.org/10.1016/j.clim.2016.06.002 (2016).

Hannigan, G. D., Duhaime, M. B., Ruffin IV, M. T., Koumpouras, C. C. & Schloss, P. D. colorectal cancer viromeの診断可能性と相互作用ダイナミクス。

Gupta, A. et al. Flavonifractor plautii, a flavonoid-degrading bacterium, with the gut microbiome of colorectal cancer patients in India. mSystems https://doi.org/10.1128/msystems.00438-19 (2019).

Vogtmann, E. et al. Colorectal cancer and the human gut microbiome: reproducibility with whole-genome shotgun sequencing. PLoS ONE https://doi.org/10.1371/journal.pone.0155362 (2016).

Feng, Q. et al. 大腸腺腫-癌のシークエンスに沿った腸内細菌叢の発達。Nat. Commun. https://doi.org/10.1038/ncomms7528 (2015).

Zeller, G. et al. 大腸癌の早期発見における糞便微生物叢の可能性。Mol. Syst. Biol. https://doi.org/10.15252/msb.20145645 (2014年)。

Yu, J. et al. 大腸癌の非侵襲的バイオマーカーの標的化に向けたツールとしての糞便微生物叢のメタゲノム解析。Gut https://doi.org/10.1136/gutjnl-2015-309800 (2015).

Yachida, S. et al. メタゲノムおよびメタボローム解析により、大腸がんにおける腸内細菌叢のステージ特異的表現型が明らかになった。Nat. Med. https://doi.org/10.1038/s41591-019-0458-7 (2019).

OpenContami: a web-based application for detecting microbial contaminants in next-generation sequencing data. Bioinformatics 37, 3021-3022 (2021).

CAS

PubMed

PubMedセントラル

Google Scholar

Salter, S. J. et al. 試薬や実験室の汚染は、シーケンスベースのマイクロバイオーム解析に決定的な影響を与える。BMC Biol.12, 87 (2014).

PubMed

PubMed Central

Google Scholar

Lin,D.ほか. 類似性の情報理論的定義. この論文では、「情報理論的な類似性の定義」、「情報理論的な類似性の定義」、「情報理論的な類似性の定義」、「情報理論的な類似性の定義」、「情報理論的な類似性の定義」、「情報理論的な類似性の定義」、「情報理論的な類似性の定義」、「情報理論的な類似性の定義」の5つの論文を発表した。

ontologyX:オントロジーデータを扱うためのRパッケージ群。Bioinformatics 33, 1104-1106 (2017).

CAS

PubMed

Google Scholar

Resnik, P. 分類法における意味的類似性:情報量に基づく尺度と自然言語の曖昧性問題への応用。J. Artif. Intell. Res. 11, 95-130 (1999).

Google Scholar

Lozupone、C. & Knight、R. UniFrac: 微生物群集を比較するための新しい系統分類法。Appl. Environ. Microbiol. 71, 8228-8235 (2005).

CAS

PubMed

パブメドセントラル

グーグルスカラー

GOに基づくタンパク質の意味的類似性の指標:系統的評価。BMCバイオインフォマティクス9, S4 (2008).

PubMed

PubMed中央

Google Scholar

Calgaro、M.、Romualdi、C.、Waldron、L.、Risso、D.、Vitulo、N. シングルセル、バルクRNA-seq、メタゲノムから得られた統計的手法をマイクロバイオームデータに適用した場合の評価。Genome Biol. 21, 191 (2020).

CAS

PubMed

PubMedセントラル

Google Scholar

Ritchie, M. E. et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43, e47 (2015).

PubMed

PubMed Central

Google Scholar

Robinson、M. D., McCarthy、D. J. & Smyth、G. K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics 26, 139-140 (2010).

CAS

PubMed

Google Scholar

(1)遺伝子発現の差分解析のためのBiocductorパッケージ。ACM Trans. Inf. Syst. 28, 1-38 (2010).

Google Scholar

Ihaka, R. & Gentleman, R. R: a language for data analysis and graphics. J. Comput. Graph. 5, 299-314 (1996).

Google Scholar

Huber, W. et al. Bioconductorによる高スループットゲノム解析のオーケストレーション。Nat. Methods 12, 115-121 (2015).

CAS

PubMed

PubMedセントラル

Google Scholar

Geistlinger, L. & Waldron, L. BugSigDB原稿の解析コード。GitHub https://github.com/waldronlab/BugSigDBPaper (2023)。

参考文献のダウンロード

謝辞
この調査は、BugSigDB にデータを提供してくれた 58 名の学生およびインターンキュレーターの働きなしには不可能であった。Ojo、C. Grace、C. Nnadi、C. Grieve、C. Apiyo、C. Anderson、D. Birnbaum、D. Oluwarotimi、E. Jessica、E. Ewete、E. Mirti、F. Zohra、F. Cuevas、I. Merit、I. Kalu、I. Kahveci、J. Shevin、J. Shudy、J. デイ、K.W.アムサット、K.ジョセフ、K.アムー、L.パーク、L.カッセルマン、L.メラー、M.デイ、M.ホヨス、M.トマトス、M.マーティン、M.ベアークランド、M.A.パービン、M.グエン、N.ユリス、P.M.ルテテ、O.ブレッシング、P. Brianna、P. Han、S. Khan、S. El Safoury、S. Chunduri、Sophy、S. Suleiman、T. Islam、T. Sil、U. Yokeeswaran、U. Ejite、U. Patel、V. Pineda、V. Goulbourne、W. Lam、Y. Javaid、Y. Wang、Z. Bailey。本書で報告された研究は、5R01CA230551(L.W.、N.S.、C.H.、H.E.J.)および5U24CA180996(L.W.)という賞番号の下、米国国立衛生研究所(National Institutes of Health)の支援を受けた。L.G.はドイツ研究財団より研究奨学金を受けた(GE3023/1-1およびGE3023/1-2)。J.B.D.は、European Research Council(ERC-2021-CoG-101002587)およびThe Leverhulme Trust(Large Centre Grant)からの資金援助を受けた。P.S.は、インド政府教育省のPrime Minister's Research Fellowship (PMRF)を受けた。

著者情報
著者および所属
ハーバード大学医学部計算生物医学センター(米国マサチューセッツ州ボストン

ルートヴィヒ・ガイストリンガー&ラファエル・S・ゴンサルベス

Institute for Implementation Science in Population Health, City University of New York School of Public Health, New York, NY, USA

Chloe Mirzayi、Fatima Zohra、Rimsha Azhar、Shaimaa Elsafoury、Clare Grieve、Jennifer Wokaty、Samuel David Gamboa-Tuz、Heidi E. Jones、Levi Waldron

ニューヨーク市立大学公衆衛生学部疫学・生物統計学科(米国ニューヨーク州ニューヨーク市

Chloe Mirzayi, Fatima Zohra, Rimsha Azhar, Shaimaa Elsafoury, Clare Grieve, Jennifer Wokaty, Samuel David Gamboa-Tuz, Heidi E. Jones & Levi Waldron

インド工科大学(IIT)マドラス校(インド、チェンナイ)バイオテクノロジー学科、ブパット&ジョティ・バイオサイエンススクール

プラティアイ・セングプタ&カーティク・ラマン

ロバート・ボッシュ・データサイエンス・人工知能センター、インド工科大学(IIT)マドラス校、インド、チェンナイ

プラティエイ・セングプタ&カーティク・ラマン

インド工科大学(IIT)マドラス校統合生物学・システム医学センター(IBSE)、インド、チェンナイ

プラティアイ・セングプタ&カーティク・ラマン

ウィキワークス(米国フロリダ州ボカラトン

アイザック・ヘクト

シンガポール科学技術研究庁ゲノム研究所(GIS)、シンガポール、シンガポール共和国

アーティー・ラヴィクリシュナン

感染症・マイクロバイオームプログラム、ブロード研究所、マサチューセッツ工科大学・ハーバード大学、米国マサチューセッツ州ケンブリッジ

エリック・フランゾーザ、カーティス・ハッテンハワー

米国マサチューセッツ州ボストン、ハーバードT.H.チャン公衆衛生大学院生物統計学科

エリック・フランゾーザ&カーティス・ハッテンハワー

ハーバード・チャン・マイクロバイオーム・イン・パブリック・ヘルス・センター(米国マサチューセッツ州ボストン、ハーバードT.H.チャン公衆衛生大学院

エリック・フランゾーザ&カーティス・ハッテンハワー

米国マサチューセッツ州ボストン、ハーバード大学医学部、マスジェネラル・ブリガム、ネットワーク医学部門

ヴィンセント・キャリー

英国・オックスフォード大学人口統計科学レヴァーハルムセンター

ジェニファー・B・ダウド

米国コロラド州デンバー、コロラド大学アンシュッツ医学部、生物医学情報学・医学部

ショーン・デイビス

イタリア・トレント大学CIBIO学部

ニコラ・セガタ&レヴィ・ウォルドロン

イタリア、ミラノ、ヨーロッパ腫瘍研究所(IEO)IRCSS

ニコラ・セガタ

貢献
L.G.とL.W.は、H.E.J.、S.D.、N.S.およびC.H.の助言を得て、研究をデザインした。F.Z.、R.A.、S.E.およびC.G.は、L.G.、C.M.およびL.W.の助言を得て、データのキュレーションとレビューを行った。I.H.は、L.G.、C.M.、F.Z.、C.H.およびL.W.の協力を得て、Semantic MediaWikiを実装した。 L.G.は、J.W.の貢献とC.M.、S.D.G.-T.およびL.W.の協力を得て、bugsigdbr R/Bioconductorパッケージを実装した、 L.G.とJ.W.はBugSigDBExportsリポジトリを実装し、S.D.とL.W.の貢献とインプットを得た。J.W.はL.G.とL.W.のインプットを得てZenodo上でデータを公開した。 L.G.は方法論の開発と実装を行い、R.G.のインプットとインプットを得てデータ解析とデータ可視化を行った、 L.G.とL.W.は、C.M.、V.C.、J.B.D.、H.E.J.、N.S.、C.H.の意見を参考に原稿を執筆した。

責任著者
Levi Waldron宛。

倫理申告
競合利益
著者らは競合する利益はないと宣言している。

査読
査読情報
Nature Biotechnology誌は、この論文の査読に貢献したAnne Hoen氏と他の匿名の査読者に感謝する。

追加情報
出版社注:Springer Natureは、出版された地図の管轄権の主張および所属機関に関して中立を保っている。

補足情報
補足情報
補足結果、図1-11および表1-6。

報告概要
権利と許可
オープンアクセス 本論文は、クリエイティブ・コモンズ表示4.0国際ライセンスの下でライセンスされている。このライセンスは、原著者および出典に適切なクレジットを付与し、クリエイティブ・コモンズ・ライセンスへのリンクを提供し、変更が加えられた場合にはその旨を示す限り、いかなる媒体または形式においても、使用、共有、翻案、配布、複製を許可するものである。この記事に掲載されている画像やその他の第三者の素材は、その素材へのクレジット表示で別段の指示がない限り、記事のクリエイティブ・コモンズ・ライセンスに含まれています。素材が記事のクリエイティブ・コモンズ・ライセンスに含まれておらず、あなたの意図する利用が法的規制によって許可されていない場合、または許可された利用を超える場合は、著作権者から直接許可を得る必要があります。このライセンスのコピーを見るには、http://creativecommons.org/licenses/by/4.0/。

転載と許可

この記事について
アップデートの確認 CrossMarkを経由して通貨と真正性を確認する
この記事の引用
BugSigDB は、幅広い宿主関連微生物シグネチャーの存在量差パターンを捉える。Nat Biotechnol (2023). https://doi.org/10.1038/s41587-023-01872-y

引用文献のダウンロード

受領
2022年10月24日

受理
2023年6月20日

出版
2023年9月11日

DOI
https://doi.org/10.1038/s41587-023-01872-y

この記事を共有する
以下のリンクをシェアすると、誰でもこのコンテンツを読むことができます:

共有可能なリンクを取得
コンテンツ共有イニシアチブSpringer Nature SharedItにより提供されています。

テーマ
バクテリア
環境微生物学
ネイチャーバイオテクノロジー (Nat Biotechnol) ISSN 1546-1696 (オンライン) ISSN 1087-0156 (印刷)

サイトマップ
Natureポートフォリオについて
ネイチャーについて
プレスリリース
プレスオフィス
お問い合わせ
コンテンツを見る
ジャーナルA-Z
テーマ別記事
ナノ
プロトコル交換
ネイチャー・インデックス
出版ポリシー
Natureポートフォリオポリシー
オープンアクセス
著者・研究者サービス
別刷りと許可
研究データ
言語編集
科学編集
ネイチャー・マスタークラス
エキスパートトレーナーによるワークショップ
研究ソリューション
図書館・機関
図書館員サービス&ツール
図書館ポータル
オープンリサーチ
図書館への推薦
広告とパートナーシップ
広告
パートナーシップとサービス
メディアキット
ブランドコンテンツ
キャリア開発
ネイチャー・キャリア
ネイチャーコンファレンス
ネイチャーイベント
地域ウェブサイト
ネイチャー アフリカ
ネイチャー・チャイナ
ネイチャー インド
ネイチャー イタリア
日本のネイチャー
ネイチャー 韓国
ネイチャー 中東
プライバシーポリシー クッキーの使用 お客様のプライバシーに関する選択/クッキーの管理 法的通知 アクセシビリティに関する声明 利用規約 お客様の米国におけるプライバシー権
シュプリンガー・ネイチャー
© 2023 シュプリンガー・ネイチャー

閉じる
その日最も重要な科学記事を無料でお届けします。
ネイチャーブリーフィングに登録する

いいなと思ったら応援しよう!