SPAdesの使い方:クイックスタートガイド

SPAdes(St. Petersburg genome assembler)は、以下のようなシーケンシングデータのアセンブルをサポートしています:

  • 第2世代シーケンシングデータ(IlluminaやIonTorrent)

  • PacBioおよびNanoporeリード(補助データとしてのみ使用可能)

SPAdesは、以下の目的で使用できます:

  • ゲノム

  • メタゲノム

  • トランスクリプトーム

  • ウイルスゲノム

現在のSPAdesのバージョンは4.0.0です。

SPAdesの基本的な使い方

以下は、よく使われるSPAdesのコマンド例です。

1. ペアエンドライブラリ(ファイルが分かれている場合)

bin/spades.py -1 left.fastq.gz -2 right.fastq.gz -o output_folder

2. ペアエンドライブラリ(インターレース形式の場合)

bin/spades.py --12 interlaced.fastq -o output_folder

3. 2つのペアエンドライブラリ(別々のファイルの場合)

bin/spades.py --pe1-1 1_left.fastq --pe1-2 1_right.fastq \
              --pe2-1 2_left.fastq --pe2-2 2_right.fastq \
              -o output_folder

4. ペアエンドライブラリとPacBioリードを併用

bin/spades.py -1 left.fastq.gz -2 right.fastq.gz \
              --pacbio pb.fastq \
              -o output_folder

5. 均一にカバーされた細菌ゲノムのアセンブル

bin/spades.py --isolate -1 left.fastq.gz -2 right.fastq.gz -o output_folder

6. メタゲノムのアセンブル

bin/spades.py --meta -1 left.fastq.gz -2 right.fastq.gz -o output_folder

7. トランスクリプトームのアセンブル

bin/spades.py --rna -1 left.fastq.gz -2 right.fastq.gz -o output_folder

8. RNAウイルスゲノムのアセンブル

bin/spades.py --rnaviral -1 left.fastq.gz -2 right.fastq.gz -o output_folder

まとめ

SPAdesは、幅広いデータタイプとアセンブル用途に対応した柔軟性の高いツールです。使いたいデータや解析目的に応じて適切なオプションを選択し、効率的なアセンブルを実現してください。

いいなと思ったら応援しよう!