SPAdesの使い方:クイックスタートガイド
SPAdes(St. Petersburg genome assembler)は、以下のようなシーケンシングデータのアセンブルをサポートしています:
第2世代シーケンシングデータ(IlluminaやIonTorrent)
PacBioおよびNanoporeリード(補助データとしてのみ使用可能)
SPAdesは、以下の目的で使用できます:
ゲノム
メタゲノム
トランスクリプトーム
ウイルスゲノム
現在のSPAdesのバージョンは4.0.0です。
SPAdesの基本的な使い方
以下は、よく使われるSPAdesのコマンド例です。
1. ペアエンドライブラリ(ファイルが分かれている場合)
bin/spades.py -1 left.fastq.gz -2 right.fastq.gz -o output_folder
2. ペアエンドライブラリ(インターレース形式の場合)
bin/spades.py --12 interlaced.fastq -o output_folder
3. 2つのペアエンドライブラリ(別々のファイルの場合)
bin/spades.py --pe1-1 1_left.fastq --pe1-2 1_right.fastq \
--pe2-1 2_left.fastq --pe2-2 2_right.fastq \
-o output_folder
4. ペアエンドライブラリとPacBioリードを併用
bin/spades.py -1 left.fastq.gz -2 right.fastq.gz \
--pacbio pb.fastq \
-o output_folder
5. 均一にカバーされた細菌ゲノムのアセンブル
bin/spades.py --isolate -1 left.fastq.gz -2 right.fastq.gz -o output_folder
6. メタゲノムのアセンブル
bin/spades.py --meta -1 left.fastq.gz -2 right.fastq.gz -o output_folder
7. トランスクリプトームのアセンブル
bin/spades.py --rna -1 left.fastq.gz -2 right.fastq.gz -o output_folder
8. RNAウイルスゲノムのアセンブル
bin/spades.py --rnaviral -1 left.fastq.gz -2 right.fastq.gz -o output_folder
まとめ
SPAdesは、幅広いデータタイプとアセンブル用途に対応した柔軟性の高いツールです。使いたいデータや解析目的に応じて適切なオプションを選択し、効率的なアセンブルを実現してください。