人工ニューラルネットワークを用いた排水処理場における微生物群集組成の予測


発行:2023年4月28日
人工ニューラルネットワークを用いた排水処理場における微生物群集組成の予測

https://microbiomejournal.biomedcentral.com/articles/10.1186/s40168-023-01519-9?utm_source=dlvr.it&utm_medium=twitter


リウ・シャオナン(Xiaonan Liu
ヨンニー&#8252
呉暁磊(ウー・シャオレイ
マイクロバイオーム11巻、記事番号:93(2023) この記事を引用する
1 Altmetric(アルトメトリック
メトリックス詳細
アブストラクト
背景
廃水処理場(WWTP)の活性汚泥(AS)は世界最大級の人工微生物生態系であり、AS系の微生物群集はWWTPの性能と密接な関係がある。しかし、その群集構造をどのように予測するかは、まだ不明である。
研究成果
ここでは、人工ニューラルネットワーク(ANN)を用いて、世界各地のWWTPから収集されたASシステムの微生物組成を予測した。Shannon-Wiener指数の予測精度R21:1は60.42%に達し、10%以上のサンプルに出現するアンプリコン配列変異体(ASV)とコアタクサの平均R21:1はそれぞれ35.09%および42.99%でした。また、ASVsの予測可能性は、その相対的な存在量や出現頻度と有意な正の相関があったが、潜在的な移動速度と有意な負の相関があることがわかった。また、ASシステムにおける硝化剤、脱窒剤、ポリリン酸蓄積生物(PAOs)、グリコーゲン蓄積生物(GAOs)、糸状生物などの典型的な機能群は、ANNモデルを用いてよく復元でき、R21:1の範囲は32.62%から56.81%だった。さらに、産業排水の流入源に含まれているかどうか(IndConInf)は、マンテル検定分析におけるASVとの相関は弱かったものの、良好な予測能力を有することがわかった。これは、従来の方法では特定できなかった重要な要因が、ANNモデルによって強調される可能性を示唆している。
結論
ASシステムの微生物組成と主要機能群は、我々のアプローチを用いて予測可能であり、IndConInfは予測に大きな影響を与えることを実証した。この結果は、ASシステムの微生物群集の予測を通じて、ASコミュニティに影響を与える要因の理解を深め、操作パラメータの改善や群集構造の制御のための知見につながる可能性があります。
ビデオ アブストラクト
背景
都市化の拡大に伴い、世界では毎年約3600億m3の廃水が発生しています[1]。廃水処理場(WWTP)の活性汚泥(AS)システムは、現在の下水処理技術の中核をなしています[2]。ASシステムでは、排水の60%近くを微生物が処理してから放流します[3]。このプロセスは、多様な微生物による有機化合物の分解、有害物質の生物変換、病原体の除去に依存しています[4,5,6]。したがって、これらのシステムに存在する微生物群集は、その性能を決定します[7]。ASシステムの微生物群集を予測し、それに影響を与える要因を探ることは、下水処理システムの設計、最適化、安定運用のための合理的な示唆を与えることになります[8,9,10,11]。しかし、廃水には常に多種類の資源が含まれているため、ASシステムは膨大な微生物多様性を示し、世界的に大きく異なっています。世界の活性汚泥コミュニティは、約10億の細菌系統を包含し、わずか28の操作分類単位(OTU)からなる小さな世界のコア細菌コミュニティが存在します[3]。ASシステムにおける微生物群集の圧倒的な分類学的多様性と可変性は、その構造と機能を正確にモデル化し予測するための大きな課題となっています。設計パラメータや環境データに応じて、WWTPのASシステム内の微生物群集をどのように予測できるかは、まだ不明です。
ASシステムには高いバイオマスや微生物の多様性が含まれており[3, 12]、微生物群集の予測は多様な要因によって複雑になっています。例えば、都市廃水と産業廃水を処理するASシステムには、それぞれ異なる微生物群集が存在し [13, 14] 、廃水の種類が微生物組成に影響を与えることが示唆されています。流入水の生分解性(生物学的酸素要求量/化学的酸素要求量(B/C比))も、AS微生物群集の形成に重要な役割を果たす。B/C比が低い、あるいは高いと、微生物の多様性や汚染物質除去負荷が低くなる可能性があり[15]、B/C比の群集構造への影響が非線形である可能性があることを示しています。近年、ハイスループット・シーケンスと多変量統計解析の統合により、ASシステムの微生物群集は、場所、地理的距離、溶存酸素(DO)、温度、水力保持時間(HRT)、汚泥保持時間(SRT)、流入・流出の化学的酸素需要(COD)、全窒素(TN)、全リン(TP)といった複数の因子と有意な相関があることが示されました[16、17]。複数の環境因子の複合的な影響により、ASシステムにおける微生物組成の予測は困難であり、WWTPの運転指導の障害となっています。
Monod方程式、Lotka-Volterraモデル、個体ベースの動的モデルなどのメカニズムに基づく運動モデルは、与えられた条件下での特定の増殖および相互作用メカニズムに基づいて、微生物群集の構造を予測することができます [18,19,20,21]. しかし、これらのモデルは、単純化された成長または相互作用の仮定により、複雑な自然界に一般化する能力が制限されています。重回帰モデルは、複数の環境因子から微生物群集構造を予測することができます。先行研究では、この方法を用いて、代表的な土壌環境因子[CおよびN濃度、pH、平均年間気温(MAT)、平均年間降水量(MAP)、純一次生産性(NPP)など]から土壌微生物群集の細菌群および真菌群を予測した[22]。しかし、重回帰モデルは環境要因の相互作用効果や非線形関係を無視するため、その研究における微生物分類群の予測可能性はせいぜい60%以下であった。ASシステムは、地理的要因、設計・運用パラメータ、物理化学パラメータなど、複数のクロスコンプレックス要因の影響を受けており、重回帰分析ではこの複雑な関係を把握するには不十分です。また、微生物群集構造をより深く理解し制御するために不可欠な、微生物分類群の予測可能性の規則性については、これまでの研究において注目されていませんでした。
人工ニューラルネットワーク(ANN)は、特定の仮定なしに適切な関係を自動的かつ定量的に学習し、システムの最適化を導く機械学習法である[23]。ANNは、変数間の非線形な関連性や予測因子間の相互作用を考慮するのに適した手法であるため、微生物群集と環境変数間のこれらの複雑な関係をモデル化するための理想的な選択肢となります[24]。ANNは、多くの生態系における環境因子と微生物群集構造の関係を分析するのに役立っているが[24,25,26]、活性汚泥システムの関連アプリケーションはまだ不十分である。複雑なシステムを予測するANNモデルの強力な能力を考慮し、我々はANNモデルがASシステムの微生物群集構造を予測できると仮定した。
ここでは、ANNモデルと環境データを用いて、世界の下水処理場から採取したASシステムの微生物群集構造を予測した。また、異なる分類群の予測可能性や、環境因子が予測に与える影響について分析した。これらの分析により、ASシステムの微生物群集に対する理解が深まり、主要な機能群を正確に予測するための合理的な示唆が得られ、より良い設計と運転パラメータ、および群集構造を制御するための理論的根拠を得ることができました。
研究成果
ASシステムにおける微生物群集構造の概要
6大陸23カ国にある269の廃水処理場から採取した777(データ漏れなし)の活性汚泥サンプルをQIIME2パイプラインで前処理することにより、AS系における微生物群集構造の基礎情報を得た。具体的には、Shannon-Wiener指数は2.90から6.41(図1a)、Pielouの均等性指数は0.50から0.90(図1b)、種の豊富さは217から2014(図1c)、Faithの系統多様性は22.58から148.33(図1d)であることがわかりました。α多様性の詳細情報は表S1に記載されている。
図1
ASシステムにおける微生物群集構造の概要。Shannon-Wiener index (a), Pielou's evenness index (b), species richness (c), Faith's phylogenetic diversity (d) の分布 e. ASシステムにおける全ASVの出現頻度と平均相対存在量分布
フルサイズ画像
さらに、ASVの平均相対存在量と出現頻度の分布特徴を分析した。その結果、ASシステムのASVは相対存在度が低いものが多く(図1e)、これは一般的な生態環境と一致することが分かりました[27]。本研究では、少なくとも10%のサンプルに出現する1493個のASVを予測し、そのうち290個はコアASV(図1e)に属し、全体的に豊富で、どこにでも存在し、頻繁に出現するASVと定義した。
ASシステムのα多様性はANNモデルで予測できる
アルファ・ダイバーシティの予測可能性
ASの群集構造の全体的な予測を得るために、まず、Shannon-Wiener指数、Pielouの均等性指数、種の豊富さ、Faithの系統的多様性など、異なるα多様性指標に対する予測モデルを構築しました。ここで、予測精度は、R21:1と名付けられた1:1の観測-予測直線(ベストフィット直線ではなく)に対する相対値で測定されるため、精度評価は定性的かつ定量的に行われる[22]。テストセットのアルファ多様性の観測値と予測値を比較したところ、Shannon-Wiener指数(図2b)、Pielouの均等性指数(図2c)、種の豊かさ(図2d)、Faithの系統多様性(図2e)の予測精度R21:1はそれぞれ60.42%、54.11%、 49.92%, 60.37% であることが判明しました。
図2
α多様性の予測 a. ANNモデルの枠組み:入力データ(青)、出力データ(赤)、入力データから出力データを計算するように訓練された予測モデル(紫)。Shannon-Wiener指数(b)、Pielou'e均等性指数(c)、種の豊かさ(d)、Faithの系統的多様性(e)の観測値と予測値の相関関係。1:1の関係を黒実線で、ベストフィットを水色破線で示す。青く塗られた領域は、ベストフィットの線の95%信頼区間を表す。予測値と観測値の間のベストフィット線のR2値と、1:1線に対するR2観測値を報告した。 f. アルファ多様性予測モデルにおける環境要因の重要度ウエイトのヒートマップ
フルサイズ画像
異なるアルファ多様性指標の予測可能性を比較したところ、Shannon-Wiener指数とPielouのevenness指数がspecies richnessよりも予測可能であることがわかり、これはspecies evennessの環境感度に関連している可能性があることがわかりました。種が絶滅の危機にさらされるずっと前に、環境条件が生態系に大きな影響を与える可能性があるため、種偶有性は豊かさよりも人間活動や環境変化に敏感であることが以前報告されている[28]。また、系統的多様性の予測精度も、種の豊かさよりも高く、種の進化史が微生物群集を取り巻く環境要因に影響される可能性があることを反映しています。
α多様性の予測に重要な環境要因
ASシステムのα多様性予測のためのモデル学習プロセスにおいて、Garsonの接続重み法[29]により、各環境要因に重要度重み値を割り当てた。重要度の高い因子ほど、モデルを用いてアルファ多様性を予測する際に、より有益な情報となる。
AS微生物群集のα多様性予測における異なる環境因子の重要性を評価するために、異なる予測モデルにおける環境因子の平均重要度重みを降順にランク付けした(Additional file 2: Figure S1)。その結果、DOはShannon-WienerとPielouの均等性指数の予測に最も重要であったが、流入関連IndConInfは種の豊かさとFaithの系統的多様性の予測に最も重要であることがわかった。気候条件の緯度(Lat)、設計に関連する窒素除去プロセス[硝化(Nitri)と脱窒(Denitri)]、曝気槽流入のCOD(AtInfCOD)、汚泥量指数(SVI)もアルファ多様性の予測に高い平均重要度ウエイトを持つ環境因子であった(図2f)。
ANNモデルによる群集構造の予測性の評価
ASVの相対的な存在量の予測可能性
ASのコミュニティ構造の深い予測を得るために、ASシステムにおけるASVの相対的な存在量を予測した。10%以上のサンプルで見つかった1493個のASV(ASVs>10%)について予測モデルを構築し、ASVs全体の3.2%、ASサンプルにおける相対存在量の64.97 ± 0.54% (mean ± SEM)を占めた(図3a). その結果、ASVs>10%の平均予測精度R21:1は35.09%であった(表S2)。さらに、R21:1が50%以上でASVs>10%の19.83%が予測でき、R21:1が30%以上でASVs>10%の60.82%が予測でき、R21:1が10%以上でASVs>10%の91.96%が予測できることがわかった(図3b)。
図3
ASVs>10%の相対存在量の予測 a. ASVs<10%とASVs>10%のASV数の割合と相対存在量 b. ASVs>10%の予測精度の分布. 濃い緑、濃い青、濃い赤の文字は、それぞれ予測精度が10%、30%、50%を超えるASVの割合を表す。 c. k-meansクラスターで色分けした環境要因の主成分分析(PCA)。 d. 重要度重み中央値の降順での環境要因の順位。
フルサイズ画像
さらに、各試料のASVs>10%サブコミュニティを丸ごと復元することで、試験試料の微生物コミュニティの構造も予測した[25]。ここでは、異なるテストサンプルのASVs>10%サブコミュニティの観測値を「観測コミュニティ」、それに対応する予測値を「予測コミュニティ」と呼ぶことにします。予測されたコミュニティと観測されたコミュニティのグループ内差とグループ間差を比較したところ、グループ内のBray-Curtis類似度がグループ間の類似度よりも有意に高いことがわかった(追加ファイル2:図S2a)。この結果からも、ANNモデルがASシステムの微生物群集構造を総合的な観点から予測できることが証明されました。
さらに、異なる分類レベルで微生物分類群を予測したところ、微生物群集構造はすべての分類レベルで33.32%から41.6%の高い平均予測精度を持つことがわかりました(Additional file 2: Figure S2b)。AS系で最も多い3つの門(Proteobacteria、Bacteroidota、Myxococcota)の予測精度R21:1は、それぞれ64.54%、55.37%、59.04%でした。また、最も多い3つの目Burkholderiales、Chitinophagales、Pseudomonadalesは、それぞれ63.89%、56.19%、42.81%のR21:1で予測された(表S3)。
ASVの予測における環境要因の重要性
また、ASVの存在量を予測するモデルの学習過程では、上記のように各環境要因に重要度重み値を割り当てた(表S4)。異なるASVs予測モデルにおける環境因子の重要度ウエイトを表示することで、環境因子が異なるASVsを予測する際のウエイトが異なることがわかった(追加ファイル2:図S3a)。さらに、k-meansクラスタリングアルゴリズムを用いて、環境因子を重要度重みに従って3つのクラスターに分類し、主成分分析(PCA)を用いて表示しました(図3c)。その結果、この3つのクラスターは、重要度重みの中央値で割った3つの部分に降順で対応していることがわかりました(図3d)。この結果から、気候条件のサンプリングモーメント温度(SMT)、設計・運転パラメータのプラント建設年(BY)とデニトリ、流入条件IndConInfと曝気槽流入全窒素(AtInfTN)、物理化学特性SVIなどを含むクラスター1の環境要因が群集構造の予測に最も寄与し、クラスター2が2番目、クラスター3が群集構造の予測に最も寄与しない要因群だった(表S5)。
そこで、微生物分類群の予測における環境要因の重要度ウエイトに何が影響しているのかを考えてみた。予測モデルを構築する前に、ASVs>10%サブコミュニティと生態環境因子との相関についてマンテル検定分析を行った(表S5)。相関分析の結果、ASVs>10%亜群集と有意に関連する環境要因は、気候条件Lat、経度(Lon)、MAT、日最高気温の年平均値(AMMinT)、サンプリング月降水量(SMP)、GDP、設計・運用パラメータNitri、物理化学特性混合液温(MIT)でした(Pearsonの ρ > 0.2, p < 0.01).群集構造の予測における環境要因の重要度と、環境要因と群集構造の相関を比較すると、多くの予測モデルで重要度のウェイトが高い環境要因の中には、ASVs>10%亜群集と強い相関がないものがあることがわかった(追加ファイル2:図 S3)。例えば、ASVの相対的な存在量の予測に重要な流入条件IndConInfとAtInfTNは、ASVs>10サブコミュニティと有意な相関がなかった。しかし、これらの違いにもかかわらず、環境要因の重要度重みとASVs>10%サブコミュニティとの相関係数の間には、有意な正の相関が見られた(Additional file 2: Figure S4a, R2 = 0.1271, p < 0.05).これらの結果から、相関分析に加えて、ANN予測モデルにおける重要度重み分析も、WWTPの性能を探る際に注目すべき環境要因の幅を広げるのに役立つことがわかりました。
さらに、環境要因の分布がその重みに与える影響についても分析した。その結果、正規化された環境要因の歪度(Additional file 2: Figure S4b; R2 = 0.6268, p < 0.001) と尖度(Additional file 2: Figure S4c; R2 = 0.7106, p < 0.001) はいずれもASVの予測における平均重要度重みと有意に負の相関があることが分かりました。このことから、歪度が低く、尖度が低い環境因子は、群集構造を予測する上でより重要である可能性が示唆された。
予測可能性の高いASVの特徴
相対的な存在量や出現頻度が高いASVは、ANNモデルを用いてよりよく予測することができる
ASVの予測精度と分布特徴の相関を調べるために、相対的な存在量と頻度が異なるASVの予測精度を比較した。10%以上のASV全1493種の予測精度R21:1とその相対存在量の相関解析の結果、ASVのR21:1はその相対存在量と有意な正の相関があり(図4a;R2 = 0.05279, P < 0.001) 、ASVの高い予測可能性はその高い相対存在量と関連している可能性を示唆する。さらに、ASVのR21:1はその出現頻度と有意水準でわずかに正の相関があり(図4b;R2 = 0.02602, P < 0.001)、10%以上の豊富なASVの高い予測可能性もその高い出現頻度に関連している可能性があることがわかった。さらに、先行研究と同様に相対的な存在量と出現頻度に基づいてASVをグループ化したところ(詳細はAdditional file 1を参照)、相対的な存在量が多く出現頻度が高いASV>10%は、相対的な存在量が少なく出現頻度が低いもの(Additional file 2: Figure S5a)、(Additional file 2: Figure S5b)よりも有意に予測可能であり、先行結果と一致した。また、ASVの出現頻度は、その相対的な存在量と有意な正の相関があり(Additional file 2: Figure S5c, R2 = 0.2978, P < 0.001) 、高い相対的存在量と高い出現頻度が予測可能性への寄与において互いに補完し合うことができることを支持していることは特筆される。
図4
ASV>10%の分布特徴と予測可能性 a. テストR21:1と平均相対存在量の相関 b. テストR21:1と出現頻度の相関 c. AS系群集形成の中立群集モデル(NCM)の適合度。青実線はSloanら[31]のNCMのベストフィットを示し、青破線はモデル予測値周りの95%信頼区間を示す。R2はこのモデルへの適合度を、mは推定移動率を示す。 d. 上、中立、下のパーティションのテストR21:1 e. テストR21:1と推定移動率の相関。f. コア分類群および非コア分類群の検定R21:1。統計解析は2標本Student's t-testで行った: ***, p < 0.001; n.s, p > 0.05、有意差なし
フルサイズ画像
これまでの研究で、希少な分類群は豊富な分類群よりも動的であることが示されていたため[30]、ある分類群の予測可能性がサンプル間の変動性と関連しているのかどうかが気になりました。この疑問を解決するために、ASVのR21:1とその変動係数の関係を分析したところ、ASVの予測精度はその変動係数と有意に負の相関があり(Additional file 2: Figure S5d; R2 = 0.01946, P < 0.001 )、変動性の高い分類群は予測性が低いことが示唆されました。
ASVの予測可能性は、潜在的な移動速度が増加するにつれて低下する。
これまでの研究で、群集形成のプロセスはその予測可能性と密接な関係があることが示されており[22, 32, 33]、ASシステムにおける微生物群集形成メカニズムと対応する分類群の予測可能性の関連性を探った。中立コミュニティモデル(NCM)モデルフィッティングにより、ASシステムにおける微生物群集の変動の63.3%を確率的プロセスが説明することがわかった(図4c)。続いて、10%以上のASVを、その出現頻度と相対的存在量によって3つのパーティション(上、下、中立)に分離しました。3つのパーティションの分布特徴を比較したところ、ASV>10%の相対的存在量(Additional file 2: Figure S6a)と出現頻度(Additional file 2: Figure S6b)は、上のパーティションよりも下のパーティションで著しく高いことがわかりました。さらに、下のパーティションの予測精度R21:1も上のパーティションより有意に高いことがわかりました(図4d)。この結果は、相対的な存在量や出現頻度が高いASVは、ANNモデルを用いてよりよく予測できることを改めて示しています。
また、NCMで評価した異なるパーティションの推定移動率も異なっていた。フィッティングカーブの上にある点は、予想以上に頻繁に発見される分類群であり、移動能力が高く、より多くの場所に分散できることを示唆している。フィッティングカーブより下の点は、予想より少ない頻度で見つかった分類群であり、地球規模でのWWTPでの分散能力が低いか、地域の環境条件に強く反応することを示唆しています。また、フィッティングの結果、上のパーティションの分類群は推定移動率が最も高く、下のパーティションの分類群は推定移動率が最も低いことが確認されました(Additional file 2: Figure S7)。さらに、異なるパーティションの移動率と予測性の関係を分析したところ、ある分類群の予測性は、その推定移動率と高い負の相関を示し(図4e、R2 = 0.996, P = 0.0401)、ASVの予測性は、その潜在移動率が高くなるほど低下することがわかりました。
ASシステムのコアタクサはANNモデルによって予測可能である。
活性汚泥は、その非常に複雑な有機環境のため、他の生息地のコアコミュニティと重複しない独自のコアコミュニティを選択する[3]。我々は、ANNモデルを用いて、豊富で偏在しているコアタクサの予測可能性を評価した。Methodsで定義したように、ASVs>10%サブコミュニティで290のコアASVと1203の非コアASVを得た(追加ファイル2:図S8a)。解析の結果、コアタクサの相対存在量(Additional file 2: Figure S8b)と出現頻度(Additional file 2: Figure S8c)は非コアタクサより有意に高く、コアタクサの推定移動率は非コアタクサより低かった(Additional file 2: Figure S8d).
コアタクサの予測性を評価したところ、コアASVの37.59%以上がR2 50%以上で良好に予測でき、78.62%以上がR2 30%以上で良好に予測でき、94.48%以上がR2 10%以上で良好に予測でき、平均予測精度は42.99%(表S2)、コアタクサでないものに比べて著しく高い(図4f)。コアタクサは、活性汚泥の窒素除去、リン除去、さらには凝集力強化に密接に関係していると報告されているため[12, 34, 35]、この結果は、コアタクサの動態を予測することにより、ANNモデルがWWTPの性能評価に利用できることを示唆している。
AS系における主要機能群の予測
WWTPの性能をより直接的に理解し制御するために、ASシステムにおける微生物群集の主要な機能群をANNモデルで予測・解析した。MiDAS4データベースを参照すると、ASシステムにおける機能群は、窒素除去群(硝化剤と脱窒剤)、リン除去群(PAOs)、およびその競争相手(GAOs)、および糸状生物[36](表S6)である。次に,同じ機能群に属するASVの相対存在量をまとめることで,各サンプルにおける異なる機能群の相対存在量の合計を算出した。最後に、ANNモデルを用いて、各機能グループの相対存在量の合計を予測した。その結果、硝化菌、脱窒菌、PAO、GAO、糸状菌の予測精度R21:1は、それぞれ32.62%、62.65%、53.46%、53.31%、62.86%となった(図5a)。
図5
主要機能群の予測 a. 硝化菌、脱窒菌、PAOs、GAOs、糸状菌のテストR21:1 b. 機能群の予測モデルにおける環境要因の重要度ウエイトのヒートマップ。これらのグラフのエラーバーは、平均値の95%信頼区間を示している。統計解析は、2標本Student's t-testを用いて行った: **, p < 0.001; n.s, p > 0.05, 有意ではない
フルサイズ画像
機能グループの予測結果をさらに理解するために、その予測モデルにおける環境要因の重要度重みも分析した。これらの異なる機能グループの予測モデルにおける環境要因の重要度の重みについてワードクラスタリング分析を行ったところ、PAOとGAOの予測における環境要因の重要度が最も似ており、次いで硝化剤と脱窒剤であった(図5b)ことから、関連機能を予測する際の環境要因の貢献度は一定であると考えられた。全体として、設計・運転パラメータBYとDenitri、流入条件IndConInf、物理化学的特性汚泥負荷(F/M)、硝酸性窒素濃度(NO3-N)が窒素・リン除去機能の予測に重要であり、気候条件LatとSMT、設計・運転パラメータNitri、物理化学特性SVIとMITは糸状菌の予測に大きく影響していた。さらに、SVIも脱窒素の予測に決定的な影響を与えたが、これは一部の糸状菌が脱窒素としても機能するためと考えられる[37]。これらの環境要因の重要性を示すために、上記の10個の高重量環境要因のみを用いて機能群を予測した。その結果、これら10個の因子のみを用いることで、R21:1の予測精度が17.25%から52.00%の範囲で、ASシステムの主要機能群の存在量を予測できることがわかった(Additional file 2: Figure S9)。
まとめると、気候条件LatとSMT、設計・運転パラメータBY、Denitri、Nitri、流入条件IndConInf、さらにASシステムのいくつかのサンプル物理化学特性(F/M、SVI、MIT、NO3-N)が、機能グループの予測に影響を与えることがわかります。これらの重要な環境因子を制御することで、WWTPの性能を調整することができ、環境の変化に応じてより合理的な運転パラメータを設計するための指針となる。
考察
本研究では、ANNモデルを用いて、ASシステムにおける微生物群集の多様性と構造、および機能群を予測した。また、予測における環境要因の重要性を評価した。
本研究で人工ニューラルネットワーク(ANN)モデルを使用することで、微生物群集の複雑なシステムの予測力が向上しました。ANNモデルを用いてサンプルの少なくとも10%に出現するASVを予測したところ、ASV>10%のうち60.82%で予測精度R21:1が30%を超えました。以前の研究では、重回帰モデルは、土壌細菌微生物群集の属レベルの分類の変動の約15%しか説明できず[22]、その群集の上位10分類群しか予測できなかったとされています。この先行研究と比較すると、予測精度が大幅に向上し、予測範囲が少なくとも10%のサンプルに出現するすべてのASVに拡大され、微生物群集の複雑なシステムの予測におけるANNモデルの応用可能性を証明することができました。複雑な微生物群集の予測において、深層学習手法としてANNモデルの利用を推奨する。
本研究では、Sloanら[31]が提案したNCM(Neutral Community Model)を用いて、移動を曖昧な定性的概念から、生物学的意味を持つ数値、潜在移動率(m)に変換した。mの値が高いほど、その種は分散による制約が少ないことを示す。本研究では、高存在量分類群の移動率が低く、低存在量分類群の移動率が高いことから(Additional file 2: Figure S10)、分散制限が高存在量分類群に大きな影響を与えるが、低存在量分類群には影響しないことが示され、これはいくつかの生態系の知見と一致している [38, 39] 。移動速度が低い高存在の分類群は、環境選択により一部のサンプルに出現し[40]、これらの環境要因を用いて相対的な存在量を十分に予測することができる。しかし、移動率の高い低存在の分類群は、通常、移動が発生したときにサンプルに現れ、サンプルの空間的不均一性によって生態的ニッチを与えられる。移動のランダム性やサンプルの空間的不均一性は、入力した環境変数には反映されておらず、そのため、これらの環境因子は低存在率の分類群の予測にあまり寄与しなかった。硝化菌の主要な属であるNitrosomonasは、ASシステムにおいて相対存在量が低く、移動が多いグループであるため(表S2)、硝化菌の予測可能性は低い(図5a)。さらに,低存在の分類群は高存在の分類群よりも存在量の変動が大きいことが報告されており[30],変動が大きい予測対象は予測モデルの安定性に寄与せず,高存在の分類群の相対存在量の予測可能性が低存在の分類群よりも著しく高いことがさらに説明される.
多くの生態系において、低存在の希少種の重要性は実証されている [27, 41]。これらの種は、必要な形質を提供したり、種間相互作用のパートナーとして機能することで、コミュニティにおいて重要な役割を果たしている [42, 43]。微生物群集における希少分類群の重要性をより深く理解するためには、低存在種を正確に同定する予測モデルを開発することが不可欠である。微生物群集は、生物学的環境要因[16]と種間相互作用[44]の両方から影響を受けるため、微生物間相互作用のメカニズムを考慮した機械学習による予測モデルは、希少種の予測精度を向上させると考えられる。
予測モデルにおける環境要因の重みは、対応する予測対象への環境要因の影響をある程度反映する。例えば、今回の結果では、evennessとrichnessの予測に影響を与える最も重要な環境因子は、それぞれDOとIndConInfであることがわかりました。均等性と豊かさは、生態系コミュニティの多様性を測定するための2つの重要な指標である。前者は種の違いを表し、後者は種の数を表す。これまでの研究で,いくつかの機能性分類群の相対的な存在量はDOの変化に敏感であることが示されており [45, 46] ,これらの機能性細菌の存在量は,群集の種の存在量の違いを反映している。したがって、DOは、ASシステムにおける微生物群集の均等性を予測する上で高いウェイトを占めている。工業廃水には、多くの微生物が生存できない有毒・有害物質[47, 48]が含まれている。したがって、工業廃水は微生物の集団に直接影響を与え[49]、IndConInfはASシステムにおける微生物群集の豊かさを予測する上で重要な役割を担っている。
さらに、環境因子が微生物分類群に与える影響は、特定の機能に関連している可能性がある。窒素除去に関連する分類群ASV6とASV142の予測モデルで上位の重みを持つ環境因子は、AtInfTN、Nitri、NO3-Nだった(表S4)。糸状菌の予測にはSVIが非常に重要である(図5b)。これは、糸状菌が汚泥のバルキングや発泡を引き起こすため[50]、SVIに影響を与えるためである。また、デニトリはPAOとGAOに最も大きな影響を与えるが、これは代表的なPAOであるCa_Accumulibacter属とGAOであるCa_Competibacter属の脱窒能と一致する [51] 。このように機能と環境因子が対応していることから、微生物分類群の予測に高いウェイトを持つ環境因子が、群集形成の決定論的過程における環境フィルタリングに不可欠な役割を担っている可能性が示唆されます。
従来の方法では特定できない重要な要因が、ANNモデリングによって浮き彫りになる可能性がある。ASシステムに関する従来の研究では、環境要因と微生物群集の相関関係にのみ着目しており[16, 17, 52]、重要な環境要因の考慮範囲が限定されていた。例えば、本研究では、流入に含まれる産業廃水源の有無(IndConInf)が、ASVs>10%予測モデルにおいて有意な予測因子であることを発見しました。この知見は、産業排水と都市下水の間で微生物群集に顕著な違いがあることを示した先行研究 [14, 53] と一致しており、IndConInfがASシステムの微生物群集構造に影響を与える可能性を示唆しています [54] 。しかし、我々の相関分析では、IndConInfと微生物群集構造との間に有意な関連は見られなかった(表S5)。実は、環境要因の相関分析は、より複雑な関係を捉えるには限界があり、単純な線形または単調な関連性しか明らかにできない[16, 55]。そのため、環境要因の影響を探る上での応用には制約がある。本研究では、予測モデルにおける環境要因の重要度を分析することで、さらなる注意が必要な変数を明らかにし、ASシステムの微生物群集をより適切に予測・制御することができました。
我々の研究は、ASシステムの微生物群集構造の予測と解釈に一定の貢献をしたが、ANNモデルのブラックボックス特性により、予測モデルにおけるいくつかの環境要因の重みを説明できないままである。その結果、歪度分布が低く、尖度分布が低い環境因子は、微生物分類群の相対存在量の予測において高いウェイトを持つ可能性が高く、現在の知見では説明できないことがわかった。ANNモデルの解釈可能性を高めることは、この強力な予測ツールを私たちの関心事の分析にうまく活用することにつながり、それは機械学習を用いたビッグデータ解析の今後の方向性でもある。
結論
本研究では、ANNモデルを用いて、α多様性、サンプルの10%以上に出現するASV、コアタクサ、主要機能群など、グローバルASシステムにおける微生物群集の構造を予測した。その結果、相対存在量が多く、出現頻度が高く、推定移動率が低い分類群は、ANNモデルによってより正確に予測されることがわかった。さらに、ANNモデルにおける環境要因の重み付け分析によって示されたように、流入する工業廃水の存在は微生物群集の予測に大きく影響した。この結果は、ASシステムにおける微生物群集の形成に産業排水が重要な役割を果たすことを示唆している。全体として、今回の発見は、複雑な微生物群集を予測するためのANNモデルの重要性を浮き彫りにしました。また、微生物分類群の予測可能性や環境要因が微生物群集に与える影響について、新たな知見を得ることができた。
研究方法
データセット
本研究では、6大陸23カ国の269のWWTPから採取された1186の活性汚泥サンプルの既発表のデータセットを使用しました。これらの汚泥サンプルの16S rRNAシーケンスデータに加え、Genomic Standards ConsortiumのMIxSおよびEnvironmental Ontology Standards [56]に準拠した関連メタデータも工場管理者および研究者から提供されました。
前回の研究で収集された1186個のサンプルの中には、同じWWTPの異なるサンプリングポイントから得られたものや、同じサンプリングポイントから異なる時期に得られたものがありました。そのため、これらのサンプル間の環境因子や群集構造は類似性が高く[3]、1186サンプルすべてでモデルを評価すると、その予測値の一般化能力を過大評価する可能性があります。そこで、この1186個のオリジナルサンプルのうち、環境情報が同じで、微生物群集の加重-UniFrac距離が最小(Q1-3IQR以下、Q1は第1四分位、IQRは四分位範囲)のサンプルを削除し、残りの777サンプル(データ漏れなし)をその後の予測モデルの構築と評価に使用しました。
データの前処理
データの正確性、完全性、一貫性を確保するため、機械学習の予測モデルを構築する前に、元データの前処理を行いました。
メタデータの前処理
先行研究(参考文献[3])から得られたメタデータについては、環境データの冗長性を減らすために、まず、操作が難しい複数カテゴリの非数値変数や、サイト名、都市名などの実用的意味のない変数を削除した。残った変数はモデルの学習に使用し、その略号と意味を表S7に示す。環境要因をより明確に理解するために,予測に使用する環境要因の種類を分類した[3],気候条件,設計・運転パラメータ,流入条件,排水条件,サンプルの物理化学的特性などである(表S7).次に、LabelEncoderアルゴリズムが、数値化された2値非数値変数に使用され、欠損値は、2近傍原理に従って補完された。さらに、次元の影響を排除するために、すべての環境因子を1-100に正規化した[24]。
機械学習予測モデルに入力するための最終的な環境データを、表S8に示す。
シーケンスデータの前処理
オリジナルの微生物シーケンスデータは、Quantitative Insights Into Microbial Ecology (QIIME2) ソフトウェア (http://qiime2.org) [57] を用いて処理されました。すべてのペアリードをマージし、品質フィルターをかけ、DADA2プラグイン[58]を通してノイズ除去し、100%のアンプリコン配列バリアント(ASV)にクラスタリングした。その後、菌類に分類されるASV、ドメインレベルで分類学的に未割り当てのASV、ミトコンドリアや葉緑体として注釈されたASVを削除し、細菌と古細菌の配列のみを保持するようにしました。シングルトン(配列が1つしかないASV)は、配列決定エラーの影響を減らすため、さらなる解析の前に破棄しました。次に、サンプルとフィーチャーの両方を最大限に観察するために、各サンプルを20,954配列に希釈し、そこから46,628個のASVを得ました。最終的な特徴配列は、MiDAS4参照データベース[36]を用いて分類学的に分類し、さらなる解析のために系統樹を系統樹プラグインを用いて作成した。
Shannon-Wiener指数、ASVカウント(種の豊かさ)、Pielouの均等性などのアルファ多様性指数は、最終特徴表に従ってR 4.0.3ソフトウェアのveganパッケージ(http://www.r-project.org)を使用して計算した。フェイスの系統多様性は、R 4.0.3ソフトウェアのPicanteパッケージを使用して、特徴量表と系統樹に従って計算した。また、この特徴量表から各ASVの相対存在量も算出した。これらの微生物群集の特徴を合わせて、AS群集予測モデルのターゲット変数とした。
人工ニューラルネットワークモデル
python 3.8のPyTorch (v1.7.1, https://pytorch.org/) ライブラリを採用し、完全連結型人工ニューラルネットワーク (ANN) を構築しました。テストの結果、層間の活性化関数としてreluとsigmoidを用いた3層ネットワーク(隠れ層を含む)は、ネットワークのトポロジーが比較的単純であることを条件に、優れた予測効果を発揮した。
第1層は入力層であり、本研究の入力データは下水処理場の環境データであった(表S8)。したがって、第1層のノードは48個であった。以前に研究されたアルゴリズムの最適化結果[59]によると、内部の隠れ層は97ノード(2n+1、nは入力ノードの数)であった。一方、出力層は1ノードで、α多様性の指標、異なるASVの相対的存在量、または機能グループの存在量に対応していた(図2a)。予測誤差を最小化するために、各ターゲットに対して別々に予測モデルを構築した。
モデルの学習過程ではランダムな操作が多く、同じコードを繰り返し実行しても結果に一貫性がない。そこで、乱数発生器のグローバルシードを固定し、繰り返し学習できるようにしました。各ランダム化によって生じる偏差を避けるため、すべてのモデルを異なるシードで20回トレーニングし、平均化した結果をさらなる分析に使用した。
アルファ多様性と微生物分類群の存在量予測モデル
α多様性については、Shannon-Wiener指数、Pielouの均等性指数、種の豊富さ、Faithの系統的多様性の予測モデルを構築した。タクサについては、出現頻度の低いタクサの相対存在量が多くのサンプルでゼロであったため、モデルがトレーニングセットに対して有用な情報を学習することが困難であった(アンダーフィッティング)。そこで、少なくとも10%のサンプルに存在するASV(ASVs>10%と命名、ASVs<10%は10%以上のサンプルに出現しないASVを表す)の相対存在量のみをモデル化して予測しました。
α多様性またはASVs>10%の存在量予測モデルを構築するためのサンプルは777個でした。ハイパーパラメータ最適化時のオーバーフィッティングのリスクを低減するため、学習プロセスにおいて4倍のクロスバリデーションを実施した。その結果、これらのモデルは、全サンプルの80%に対して4重クロスバリデーションを適用することで開発された。モデルの性能を評価するために、全体のサンプルの残り20%からなるテストセットを使用した。また、モデルの偏りを避けるため、すべてのモデルを異なるシードで20回学習させた。最後に、平均化された結果に基づいて、モデルの性能が評価された。
ANNモデルの学習過程では、決定係数(R2)と平均二乗誤差(MSE)を用いて、精度と損失を評価した。ハイパーパラメータの最適化後、バッチサイズ256、学習率0.00001、ドロップアウト0、ウェイト減衰0.01のAdamオプティマイザを用いて、これらのモデルの学習を行った。モデルが最適となる反復回数を求めるため、反復回数によるR2とMSEの変化を繰り返し検証した(Additional file 2: Figure S11)。その結果、反復回数が5000回に達すると、ほとんどのモデルのR2とMSEが安定し始めることが分かりました。反復の時間的コストと最も低い損失とのトレードオフを考慮し、すべてのモデルの反復回数を10,000回に設定しました。
中立的なコミュニティモデルから中立的・非中立的なパーティションへ
WWTPのコミュニティ形成における確率的プロセスの潜在的重要性を判断するために、我々は中立コミュニティモデル(NCM)を用いて、ASVの出現頻度と、より広いメタコミュニティにおける相対的存在量との関係を予測した[31]。このモデルは、大規模な微生物集団に調整された中立理論の適応である。このモデルでは、mはコミュニティ間の分散を推定するもので、推定移動速度である。移動率mの推定はサンプルの配列数に影響されるため、中立コミュニティモデルを当てはめる前に各サンプルの配列数を2000に平坦化し、異なる微生物パーティションの推定移動率を比較できるようにしました。
本研究では、全46,628個のASVを、NCM予測値の95%信頼区間よりも発生頻度が高い(above partition)、低い(under partition)、または範囲内(neutral partition)かによって3つのパーティションに分離した[60]。ASVの潜在的な移動速度が予測可能性に及ぼす影響を探るため、ASVs>10%の共通サブコミュニティに属する異なる(上、中立、下)パーティションの予測精度を分析し比較しました。
コアタクサの定義
複数の報告された指標に基づいて、WWTPのグローバルスケールのコア微生物サブコミュニティが決定されました。本報告では、ASVレベル(類似度100%)での微生物分類群の予測可能性を探ったため、コアASVの分類基準はコアOTUの分類基準とは若干異なるものであった[3]。まず、全サンプルにわたる平均相対存在量(MRA)に従って、「全体的に豊富なASV」をフィルタリングで除外しました。上位1%のASVをすべてoverall abundant ASVとして選択しました。次に、「ユビキタスASV」は、全サンプルの20%以上に出現頻度があるASVと定義しました。最後に、「出現頻度の高いASV」は、サンプル内の相対的な存在量に基づいて選択された。各サンプルにおいて、ASVは他のASVよりも相対的な存在量が高く、サンプル内のリードの上位80%を占める場合に、豊富なASVと定義されました[34]。頻繁に存在するASVは、サンプルの少なくとも10%で存在すると定義された。コアASVは、上記と同じ基準に従い、上位1%のASVから検出されるものであるべきで、コアASVはまた、サンプルの20%以上で検出され、サンプルの10%以上で優勢である必要がありました。コアタクサに対応し、上記3つの条件を満たさないASVはノンコアタクサと呼ばれました。
統計解析
すべてのアルファ多様性測定は、R(v.4.0.3)のveganパッケージとPicanteパッケージを使用して実施した。特に指示がない限り、比較統計にはR 4.0.3のstatsパッケージのt.test関数を用いて、無対、両側、2標本のStudentのt-testを実行した。異なるパラメータ間の線形相関分析は、R 4.0.3のstatsパッケージのlm関数を用いて実施した。すべての解析とグラフ作成は、R4.0.3またはpython3.8を使用しました。
データおよび資料の入手方法
本試験の生データは参考文献[3]から引用した。本研究のすべての解析データは、Additional file 3に掲載されています。ソースコードは https://github.com/Neina-0830/WWTP_community_prediction で公開されています。
参考文献
Jones ER, van Vliet MTH, Qadir M, Bierkens MFP. 排水の生産、収集、処理、再利用に関する国レベルおよびグリッド化された推定値。Earth System Sci Data. 2021;13:237-54.
記事 Google Scholar
van Loosdrecht MCM, Brdjanovic D. Anticipating next century of wastewater treatment. Science. 2014;344:1452-3.
記事 PubMed Google Scholar
Wu L, Ning D, Zhang B, Li Y, Zhang P, Shan X, Zhang Q, Brown MR, Li Z, Van Nostrand JD, et al. 下水処理場における細菌群集のグローバル多様性と生物地理学。Nat Microbiol. 2019;4:1183-95.
記事CAS PubMed Google Scholar
メタゲノム解析による活性汚泥中の有機汚染物質の生分解遺伝子の分布の解明。Bioresour Technol. 2013;129:209-18.
記事CAS PubMed Google Scholar
活性汚泥中のフルオロテトラマーアルコールの好気性生物変換におけるパーフルオロカルボン酸(PFCAs)生成に及ぼす微生物活性の影響。Sci Total Environ. 2018;610-611:776-85.
記事 PubMed Google Scholar
Wang M, Chen H, Liu S, Xiao L. 異なる前処理アプローチによる廃棄物活性汚泥からの病原体と抗生物質耐性遺伝子の除去。Sci Total Environ. 2021;763:143014-23.
記事CAS PubMed Google Scholar
Singleton、Petriglieri F、Kristensen JM、Kirkegaard RH、Michaelsen TY、Andersen MH、Kondrotaite Z、Karst SM、Dueholm MS、Nielsen PH、Albertsen M. Long-read sequencingによる活性汚泥からの1000以上の高品質メタゲノム集合ゲノム回収で構造を機能につなげることができた。Nat Commun. 2021;12:2009-21.
記事CAS PubMed PubMed Central Google Scholar
Nierychlo M, Andersen KS, Xu Y, Green N, Jiang C, Albertsen M, Dueholm MS, Nielsen PH. MiDAS 3: An ecosystem-specific reference database, taxonomy and knowledge platform for activated sludge and anaerobic digesters reveals species-level microbiome composition of activated sludge. Water Res. 2020;182:115955-66.
記事CAS PubMed Google Scholar
Herold M, Martinez Arbas S, Narayanasamy S, Sheik AR, Kleine-Borgmann LAK, Lebrun LA, Kunath BJ, Roume H, Bessarab I, Williams RBH, et al. 時系列メタオミックデータの統合により、微生物生態系が攪乱にどう反応するか明らかになった。Nature Commun. 2020;11:5281-94.
記事CAS Googleスカラー
Griffin JS, Wells GF. 決定論的な微生物群集の集合によるフルスケール活性汚泥バイオリアクターの地域的同期性。ISME J. 2017;11:500-11.
記事CAS PubMed Google Scholar
Nielsen PH, Saunders AM, Hansen AA, Larsen P, Nielsen JL. 廃水からの生物学的リン除去の強化に関与する微生物群-環境バイオテクノロジーのモデルシステム-. Curr Opin Biotechnol. 2012;23:452-9.
論文CAS PubMed Google Scholar
Zhang T, Shao MF, Ye L. 454 pyrosequencing reveals bacterial diversity of activated sludge from 14 sewage treatment plants. ISME J. 2012;6:1137-47.
論文CAS PubMed Google Scholar
Shchegolkova NM, Krasnov GS, Belova AA, Dmitriev AA, Kharitonov SL, Klimina KM, Melnikova NV, Kudryavtseva AV. 異なる廃水組成の処理プラントにおける活性汚泥の微生物群集構造. Front Microbiol. 2016;7:90-104.
記事 PubMed PubMed Central Google Scholar
Ibarbalz FM, Figuerola EL, Erijman L. Industrial activated sludge exhibit unique bacterial community composition at high taxonomic ranks. Water Res. 2013;47:3854-64.
記事CAS PubMed Google Scholar
Zhang B, Ning D, Yang Y, Van Nostrand JD, Zhou J, Wen X. Biodegradability of wastewater determines microbial assembly mechanisms in full-scale wastewater treatment plant. Water Res. 2020;169:115276-84.
記事CAS PubMed Google Scholar
魏Z、劉Y、馮K、李S、王S、金D、張Y、陳H、殷H、徐M、鄧Y.廃水処理場の季節的・空間的変動における菌類群集と細菌群集の乖離。Sci Total Environ. 2018;628-629:969-78.
記事 PubMed Google Scholar
Tian L, Wang L. A meta-analysis of microbial community structures and associated metabolic potential of municipal wastewater treatment plants in global scope. Environment Poll. 2020;263:114598-608.
記事CAS Googleスカラー
Gonzalez-Cabaleiro R, Ofiteru ID, Lema JM, Rodriguez J. Microbial catabolic activities are naturally selected by metabolic energy harvest rate. ISME J. 2015;9:2630-41.
記事CAS PubMed PubMed Central Google Scholar
Bairey E, Kelsic ED, Kishony R. 高次の種間相互作用が生態系の多様性を形成する。Nat Commun. 2016;7:12285-91.
記事CAS PubMed PubMed Central Google Scholar
Wang M, Liu X, Nie Y, Wu XL. 還元進化を駆動する利己主義が、空間的に構造化された微生物群集の相互依存パターンを形成する。isme j. 2020;15:1387-401.
記事 PubMed PubMed Central Google Scholar
Liu X, Wang M, Nie Y, Wu X-L. より分散された方法で空間の微生物コロニー化を成功させる。ISME Commun. 2021;1:68-77.
記事 PubMed PubMed Central Google Scholar
Averill C, Werbin ZR, Atherton KF, Bhatnagar JM, Dietze MC. 土壌マイクロバイオームの予測可能性は、空間的および分類学的スケールとともに増加する。Nat Ecol Evol. 2021;5:747-56.
論文 PubMed Google Scholar
Krogh A. 人工神経回路網とは?Nat Biotechnol. 2008;26:195-7.
論文CAS PubMed Google Scholar
Larsen PE, Field D, Gilbert JA. 人工ニューラルネットワークアプローチを用いた細菌群集の予測。Nat Methods. 2012;9:621-5.
論文CAS PubMed Google Scholar
Kuang J, Huang L, He Z, Chen L, Hua Z, Jia P, Li S, Liu J, Zhou J, Shu W. Predicting taxonomic and functional structure of microbial communities in acid mine drainage. ISME J. 2016;10:1527-39.
記事CAS PubMed PubMed Central Google Scholar
Coutinho FH, Thompson CC, Cabral AS, Paranhos R, Dutilh BE, Thompson FL. 人工ニューラルネットワークを用いた海洋プランクトン微生物群集に対する環境パラメータの影響のモデリング。Sci Total Environ. 2019;677:205-14.
記事CAS PubMed Google Scholar
Lynch MDJ, Neufeld JD. 希少生物圏の生態と探査。Nat Rev Microbiol. 2015;13:217-29.
記事CAS PubMed Google Scholar
Chapin Iii FS, Zavaleta ES, Eviner VT, Naylor RL, Vitousek PM, Reynolds HL, Hooper DU, Lavorel S, Sala OE, Hobbie SE, et al. Consequences of changing biodiversity. Nature. 2000;405:234-42.
記事 Google Scholar
Henríquez PA, Ruz GA. ランダムな重みを持つニューラルネットワークにおける隠れニューロンの刈り込みのための非反復法。Appl Soft Comput. 2018;70:1109-21.
記事 Google Scholar
Kim TS, Jeong JY, Wells GF, Park HD. 活性汚泥バイオリアクターにおいて、一般細菌と希少細菌が異なる時間的動態パターンを示す。Appl Environ Microbiol. 2013;97:1755-65.
CAS Google Scholar
Sloan WT, Lunn M, Woodcock S, Head IM, Nee S, Curtis TP. 原核生物の群集構造を形成する際の移民と偶然の役割を定量化する。Environ Microbiol. 2006;8:732-40.
論文 PubMed Google Scholar
Song C, Fukami T, Saavedra S. Untangling complexity of priority effects in multispecies community. Ecol Lett. 2021;24:2301-13.
記事 PubMed Google Scholar
Pagaling E, Strathdee F, Spears BM, Cates ME, Allen RJ, Free A. Community history affects the predictability of microbial ecosystem development. ISME J. 2014;8:19-30.
記事 PubMed Google Scholar
Saunders AM、Albertsen M、Vollertsen J、Nielsen PH. 活性汚泥の生態系には、豊富な生物のコアコミュニティが存在する。ISME J. 2016;10:11-20.
記事CAS PubMed Google Scholar
Matar GK, Bagchi S, Zhang K, Oerther DB, Saikaly PE. フルスケール膜バイオリアクターの膜バイオフィルム共同体は、ランダムに集合しておらず、コアマイクロバイオームから構成されている。Water Res. 2017;123:124-33.
記事CAS PubMed Google Scholar
MiDASGC、Albertsen M、Nielsen PH: MiDAS 4: A global catalogue of full-length 16S rRNA gene sequences and taxonomy for studies of bacterial communities in wastewater treatment plant. Nat Commun. 2022;13:1908-22.
記事CAS PubMed PubMed Central Google Scholar
Nielsen PH, de Muro MA, Nielsen JL: 活性汚泥に存在するThiothrix spp.のin situ生理学に関する研究。Environ Microbiol. 2000, 2:389-398.
Jiao S, Lu Y. 土壌pHと温度は、農業生態系における豊富な細菌群集と希少な細菌群集の集合過程を制御する。Environ Microbiol. 2020;22:1052-65.
記事 PubMed Google Scholar
Wu W, Logares R, Huang B, Hsieh CH. 北西太平洋の限界海域の表層水域において、豊富なピコエウカリオティック・サブコミュニティと希少なピコエウカリオティック・サブコミュニティは対照的なパターンを示す。Environ Microbiol. 2017;19:287-300.
記事CAS PubMed Google Scholar
西亜熱帯太平洋における豊富な微生物群集と希少な微生物群集の生物多様性とバイオジオグラフィー。Front Microbiol. 2022;13:839562-75.
記事 PubMed PubMed Central Google Scholar
Jousset A, Bienhold C, Chatzinotas A, Gallien L, Gobet A, Kurm V, Kusel K, Rillig MC, Rivett DW, Salles JF, et al. Where less may be more: How the rare biosphere pulls ecosystems strings. ISME J. 2017;11:853-62.
記事 PubMed PubMed Central Google Scholar
Shade A, Jones SE, Caporaso JG, Handelsman J, Knight R, Fierer N, Gilbert JA, Dubilier N: Conditionally rare taxa disproportionately contribute to temporal changes in microbial diversity.mBio. 2014, 5:e01371-01314.
Fetzer I, Johst K, Schäwe R, Banitz T, Harms H, Chatzinotas A. The extent of functional redundancy changes as species' roles shift in different environments. Proc Nat Acad Sci U S A. 2015;112:14888-93.
記事CAS Googleスカラー
世界各地に分散する下水処理場の活性汚泥において、分類学的な関連性が細菌の集合体を形成している。Environ Microbiol. 2014;16:2421-32.
記事CAS PubMed Google Scholar
Cao Y, Zhang C, Rong H, Zheng G, Zhao L. The effect of dissolved oxygen concentration (DO) on oxygen diffusion and bacterial community structure in moving bed sequencing batch reactor (MBSBR)。Water Res. 2017;108:86-94.
記事CAS PubMed Google Scholar
Laureni M, Weissbrodt DG, Villez K, Robin O, de Jonge N, Rosenthal A, Wells G, Nielsen JL, Morgenroth E, Joss A. バイオフィルムとフロック間のバイオマス分離は、主流の部分硝化およびアナモックス処理における亜酸化窒素細菌の制御を改善する。Water Res. 2019;154:104-16.
記事CAS PubMed Google Scholar
Liang S-x. Wang J, Qin Z, Zhao C, Jin X, Chen J: Biotoxicity and by-product identification of dye wastewaters. Water Pract Technol. 2019;14:449-56.
記事 Google Scholar
Hubadillah SK, Othman MHD, Tai ZS, Jamalludin MR, Yusuf NK, Ahmad A, Rahman MA, Jaafar J, Kadir SHSA, Harun Z. Novel hydroxyapatite-based bio-ceramic hollow fiber membrane derived from waste cow bone for textile wastetewater treatment. Chem Eng J. 2020;379:122396-407.
記事CAS Googleスカラー
工業地帯および市街地における廃水処理場の活性汚泥微生物群集と処理性能(Yang Y, Wang L, Xiang F, Zhao L, Qiao Z.) Int J Environ Res Public Health. 2020;17:436-50.
記事CAS PubMed PubMed Central Google Scholar
Guo F, Zhang T. Profiling bulking and foaming bacteria in activated sludge by high throughput sequencing. Water Res. 2012;46:2772-82.
論文CAS PubMed Google Scholar
Lemaire R, Yuan Z, Blackall LL, Crocetti GR: 実験室規模の生物学的栄養除去システムの好気性顆粒におけるAccumulibacter spp.とCompetibacter spp.の微生物的分布。Environ Microbiol. 2008, 10:354-363.
ハイスループット16S rDNAシーケンスに基づく中国WWTPの活性汚泥システムにおける微生物群集構造の地域的不一致。Sci Total Environ. 2021;818:151751-8.
記事 PubMed Google Scholar
ファンXY、ガオJF、パンKL、リーDC、ダイHH、リーX。異なる種類の廃水を処理する16の本格的な廃水処理場における機能的な属、潜在的な病原体および予測される抗生物質耐性遺伝子。Bioresource Technol. 2018;268:97-106.
記事CAS Googleスカラー
Sun H, Chang H, Tang W, Zhang X, Yang H, Zhang F, Zhang Y. 活性汚泥微生物群集の細菌集合に及ぼす流入移民と環境要因の影響。Environ Res. 2022;205:112426-35.
論文CAS PubMed Google Scholar
Guo H, Nasir M, Lv J, Dai Y, Gao J. High throughput sequencingを用いた重金属汚染土壌における微生物群集の変動の解明。Ecotoxicol Environ Safety. 2017;144:300-6.
記事CAS PubMed Google Scholar
Yilmaz P, Kottmann R, Field D, Knight R, Cole JR, Amaral-Zettler L, Gilbert JA, Karsch-Mizrachi I, Johnston A, Cochrane G, et al. マーカー遺伝子配列に関する最小情報(MIMARKS)および任意の(x)配列に関する最小情報(MIXS)仕様書。Nat Biotechnol. 2011;29:415-20.
記事CAS PubMed PubMed Central Google Scholar
Bolyen E, Rideout JR, Dillon MR, Bokulich NA, Abnet CC, Al-Ghalith GA, Alexander H, Alm EJ, Arumugam M, Asnicar F, et al. Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. Nat Biotechnol. 2019;37:852-7.
記事CAS PubMed PubMed Central Google Scholar
Callahan BJ, McMurdie PJ, Rosen MJ, Han AW, Johnson AJ, Holmes SP. DADA2:イルミナのアンプリコンデータからの高解像度サンプル推論。Nat Methods. 2016;13:581-3.
記事CAS PubMed PubMed Central Google Scholar
Stathakis D. 隠れ層とノードはいくつあるか?Int J Remote Sensing. 2009;30:2133-47.
記事 Google Scholar
亜熱帯河川における雨季と乾季の微小真核生物群集の形成は、確率的プロセスによって形成されている。Microbiome. 2019;7:138-53.
記事 PubMed PubMed Central Google Scholar
リファレンスのダウンロード
謝辞
サンプルと植物のメタデータを提供してくださったGlobal Water Microbiome Consortium(GWMC)および関係者の皆様に感謝します。また、コンピューティングプラットフォームを提供していただいた北京大学High-performance Computing Platformに感謝する。
資金提供について
本研究は、中国国家重点研究開発プログラム(2018YFA0902100および2021YFA0910300)および中国国家自然科学基金(91951204、32130004、32161133023、32170113)から資金提供を受けた。
著者情報
著者と所属
北京大学工学部、100871、北京、中国
リュウ・シャオナン、ニー・ヨン、ウー・シャオレイ
北京大学海洋研究所(〒100871 中国北京市旭町1-1-1
呉暁磊(ウー・シャオレイ
北京大学生態学研究所、100871、北京、中国
呉暁磊(ウー・シャオレイ
貢献度
X.L.が研究を考案し、すべての分析および計算を行った。X.L.とY.N.は論文を共同執筆し、X.L.W.はそれを修正した。著者全員が結果について議論し、論文にコメントした。最終原稿は著者が読み、承認した。
対応する著者
Yong Nie または Xiao-Lei Wu に対応しています。
倫理に関する宣言
倫理的承認と参加への同意
該当事項はありません。
掲載の同意について
該当事項はありません。
競合する利益
著者は、競合する利害関係がないことを宣言する。
追加情報
出版社ノート
シュプリンガー・ネイチャーは、出版された地図や所属機関の管轄権主張に関して、中立を保っています。
補足情報
追加ファイル1.
補足的な解析。ASV>10%のグループ分けと比較。
追加ファイル2:
図S1. 異なるα多様性予測モデルにおける環境要因の重要度ランキング。図S2 a. 予測された群集と観測された群集のグループ内およびグループ間のBray-Curtis類似度の比較 b. 異なる分類レベルの微生物分類群の平均予測精度 R21:1. 図S3. 環境要因の重要度重みとピアソンの相関係数。図S4. ASVs>10%subcommunityの環境要因の相関係数、正規化した環境変数の歪度、尖度とそのギャルソン接続重みとの相関。図S5 a. 低・中・高頻度分類群間の予測精度R21:1の比較 b. 低・中・高頻度分類群間の予測精度R21:1の比較 c. 相対存在量とASVsの出現頻度の相関 d. テストセットのR21:1とASVsの変動係数の相関。図S6. 上、中立、下パーティション間の平均相対存在量と出現頻度の比較。図S7. 図7.上方、中立、下方パーティションの中立コミュニティモデル(NCM)の適合度。図S8.コア分類群と非コア分類群の分類学的組成、平均相対存在量、出現頻度、推定移動率。図S9. 10個の高重量環境因子による機能グループの予測。図S10. 高存在、中存在、低存在のサブコミュニティに関する中立コミュニティモデル(NCM)の適合性。図S11. 検証セットにおける平均二乗誤差(MSE)と決定係数(R2)のモデル学習時のエポック数による変化。
追加ファイル3:
表S1. ASシステムのα多様性 表S2. 表S2. ASVs>10%サブコミュニティに属するASVsの概要.表S3. 異なる分類レベルの微生物分類群のまとめ。表S4. 異なるASVsの予測モデルにおける環境要因の平均重要度。表S5. 異なる環境変数のまとめ。表S6. 主要機能群に属する属の概要。表S7. 環境変数の略語、意味、および種類。表S8. 数値と正規化された環境データ。
権利と許可
オープンアクセス この記事は、クリエイティブ・コモンズ 表示 4.0 国際ライセンスの下でライセンスされています。このライセンスは、原著者と出典に適切なクレジットを与え、クリエイティブ・コモンズ・ライセンスへのリンクを提供し、変更があった場合にそれを示す限り、あらゆる媒体や形式での使用、共有、適応、配布および複製を許可します。この記事に掲載されている画像やその他の第三者の素材は、素材へのクレジット表示で別段の指示がない限り、記事のクリエイティブ・コモンズ・ライセンスに含まれています。素材が記事のクリエイティブ・コモンズ・ライセンスに含まれておらず、あなたの意図する使用が法的規制によって許可されていない場合、または許可された使用を超える場合、あなたは著作権者から直接許可を得る必要があります。このライセンスのコピーを見るには、http://creativecommons.org/licenses/by/4.0/。クリエイティブ・コモンズ・パブリック・ドメインの献呈放棄(http://creativecommons.org/publicdomain/zero/1.0/)は、データへのクレジット表記がない限り、この記事で利用可能になったデータにも適用されます。
転載と許可
この記事について
この記事を引用する
Liu, X., Nie, Y. & Wu, XL. 人工ニューラルネットワークを用いた廃水処理場における微生物群集組成の予測。Microbiome 11, 93 (2023). https://doi.org/10.1186/s40168-023-01519-9
引用元:ダウンロード
2022年9月14日受理
2023年3月16日受理
2023年4月28日発行
DOIhttps://doi.org/10.1186/s40168-023-01519-9
この記事を共有する
以下のリンクを共有した人は、このコンテンツを読むことができるようになります:
共有リンクを取得する
コンテンツ共有イニシアティブ「Springer Nature SharedIt」により提供されます。
キーワード
活性汚泥
人工神経回路網
予想
微生物組成物
機能性グループ
マイクロビオーム
ISSN: 2049-2618
お問い合わせ
投稿に関するお問い合わせ: lyndie.manicani@springernature.com
一般的なお問い合わせ先: info@biomedcentral.com
ブログで詳しく見る
BMCのニュースレターを受信する
記事アラートの管理
著者のための言語編集
著者のための科学編集
ポリシー
アクセシビリティ
プレスセンター
サポート・お問い合わせ
フィードバックを残す
採用情報
BMCをフォローする
BMCのTwitterページ
BMCのFacebookページ
BMC Weiboページ
このウェブサイトを使用することで、当社の利用規約、カリフォルニア州プライバシーステートメント、プライバシーステートメント、およびクッキーポリシーに同意したことになります。クッキーを管理する/私たちはプリファレンスセンターで使用する私のデータを販売しないでください。
© 2023 BioMed Central Ltd 特に断りのない限り、BioMed Central Ltd。シュプリンガー・ネイチャーの一部です。


この記事が気に入ったらサポートをしてみませんか?