初心者の菌叢解析 Qiime2で解析(12) 有意に変化した菌を見つける~Differential abundance testing with ANCOM~
多様性解析を行い、菌叢の構造の変化が分かってくると、次はどの菌が変化したのかという点に興味がわいてきます。
そこで、今回はQiime2のチュートリアルにもある「ANCOM」解析にて有意に変化した菌を見つけます。
1.ANCOM解析の注意点
私は統計に詳しいわけではないのですが、Qiime2のチュートリアルによると、あまり変化しない2群間における変化を見つけるという点においてANCOMは威力を発揮するようです。
2群間で25%以上の菌が変化している場合は解析を行わないでくださいと書いてあります。今回はマウスの腸内細菌叢と海洋の細菌叢を用いており、菌叢の差が大きな為、ANCOM解析が適しているとは言えないと思います。
菌株レベル(Feature)で見た場合、ほとんどの菌が変化していると言えるので、ここではチュートリアルとしてLevel 2(門レベル)の解析を行います。
2.解析ファイルを作成する
まずは解析ディレクトリに移動し、Qiime2を起動します。
その後、解析用ディレクトリを作成します。
解析したいレベル毎にディレクトリを作成してください。
cd /Users/ユーザー名/Desktop/Qiime2_test
conda activate qiime2-2021.2
mkdir ANCOM ANCOM/Level_2
3.解析するレベルのtable.qzaを作成する
解析するLevel 2のtable.qzaを作成します。
「--p-level 2」の部分がレベルの指定です。保存先や生成するファイル名も抽出するレベルに合わせて変更してください。
qiime taxa collapse \
--i-table table.qza \
--i-taxonomy taxonomy.qza \
--p-level 2 \
--o-collapsed-table ANCOM/Level_2/L2_collapsed_table.qza
4.全ての値に1を足す
ANCOMの解析では「0」が許容されません。もちろん全く存在しない菌がいる場合もありますので、ここでは全ての値に「1」を追加します。
qiime composition add-pseudocount \
--i-table ANCOM/Level_2/L2_collapsed_table.qza \
--o-composition-table ANCOM/Level_2/L2_comp-collapsed_table.qza
「--i-table」の部分には先ほど作成した「L2_collapsed_table.qza」を入れています。
5.ANCOM解析を行う
以下のコマンドにてANCOM解析を実施します
qiime composition ancom \
--i-table ANCOM/Level_2/L2_comp-collapsed_table.qza \
--m-metadata-file sample-metadata.txt \
--m-metadata-column Origin \
--o-visualization ANCOM/Level_2/L2-ancom-Origin
ポイントは「--m-metadata-column」のコマンドになります。ここでは解析したいグループの情報を入れます。
このグループ分けはmetadataファイルに自分で設定したものです。
私の場合は「Origin」というグループを作成していますので、こちらを入力しています。大文字、小文字もmetadataと完全一致させることをお忘れ無く。
うまくいけば「ANCOM」の中の「Leve_2」というディレクトリに
「L2-ancom-Origin.qzv」ファイルが生成されると思います。
6.データの確認
生成されたqzvファイルをQiime2 viewで確認してみましょう。
まずはボルケーノプロットが確認できます。その下に有意に変化したLevel_2のリストがあります。ここでは6つの門で差があるようです。
7.菌種レベルでの解析
ここではLevel 2での解析を行っていますが、数字を変化させれば各Levelでの解析ができます。また、菌種(Feature)Levelでの解析も可能ですので、実施してみてください。
その場合は以下の方法でできると思います。そのままの「table.qza」ファイルを利用します。
mkdir ANCOM/Feature
qiime composition add-pseudocount \
--i-table table.qza \
--o-composition-table ANCOM/Feature/Feature_comp_table.qza
qiime composition ancom \
--i-table ANCOM/Feature/Feature_comp_table.qza \
--m-metadata-file sample-metadata.txt \
--m-metadata-column Origin \
--o-visualization ANCOM/Feature/Feature-ancom-Origin
今回の解析では差のあるFeatureが多すぎるので、解析は実施しません。
動作確認できていませんが解析してみてください。おそらくそれなりの時間がかかると思います。
Featureレベルで解析するとデータとして見られるのは「Feature ID」になると思います。Feature IDがどのような菌なのかは「rep-seqs.qzv」を見ることで、確認できます。
以前の投稿をご確認ください。
今回は以上になります。
見ていただきありがとうございました。
今回もQiime2のチュートリアルを参考に記事を書いています。