qiime2Rを用いてβ多様性解析を美しく描画
この記事では、バイオインフォマティクス解析ツールQiime2で得られたデータから、統計計算環境Rを用いたβ多様性解析のデザインについて説明します。
実行環境とソフト
実行環境:Ubuntu 22.04.2 LTS (GNU/Linux 5.15.146.1-microsoft-standard-WSL2 x86_64)
実行ソフト:QIIME 2 2023.9 Amplicon Distribution上のR version 4.2.2
※WSL上でQiime2をactivateし、RでR環境を立ち上げています。
conda activate qiime2-amplicon-2023.9
R
データの読み込み
tidyverseとqiime2Rをインストール。
Rでメタデータとα多様性データを読み込みます。
install.packages("tidyverse")
library(tidyverse)
if (!requireNamespace("devtools", quietly = TRUE)){install.packages("devtools")}
devtools::install_github("jbisanz/qiime2R")
library(qiime2R)
metadata <- read_q2metadata("sample-metadata.tsv")
メタデータ
> head(metadata)
SampleID 3groups 4groups days-since-experiment-start date-taken
1 imm2rpt imm imm 0 231116
2 imm3rpt imm imm 0 231116
3 imm4rpt imm imm 0 231116
4 1day3 1day 1day 1 231030
5 1day4 1day 1day 1 231030
6 1dayrpt 1day 1day 1 231116
"qiime diversity core-metrics-phylogenetic"で得られるα多様性指数及びβ多様性指数を読み込みます。
wunifrac <- read_qza("beta-diversity/core-metrics-results/weighted_unifrac_pcoa_results.qza")
shannon <- read_qza("beta-diversity/core-metrics-results/shannon_vector.qza")$data %>% rownames_to_column("SampleID")
β多様性の可視化
微生物群集間の差を探求するためよく用いられる、主座標分析(Principal Coordinate Analysis)を実施します。
主成分分析(Principal Component Analysis)との違いについては、ユークリッド距離を扱うかどうかのようです。ここで用いる距離はUniFrac, Jaccard, Bray-Curtis全てユークリッド距離ではありません。
以下の記事でPCoAについて解説されています。
https://hoxo-m.hatenablog.com/entry/20120313/
可視化します。
wunifrac$data$Vectors %>%
select(SampleID, PC1, PC2) %>%
left_join(metadata) %>%
left_join(shannon) %>%
ggplot(aes(x=PC1, y=PC2, color=`4groups`, size=shannon_entropy)) +
geom_point(alpha=0.5) +
theme_q2r() +
scale_shape_manual(values=c(16,1), name="Antibiotic Usage") +
scale_size_continuous(name="Shannon Diversity") +
scale_color_discrete(name="4groups")
ggsave("beta-diversity/PCoA_wunifrac_0314.png", height=4, width=5, device="png")
まとめ
この記事では、Rを用いたβ多様性の可視化方法を説明しました。
異なるグループの微生物群集間の差を調査することができます。
次回はβ多様性の可視化をします