STARでRNA-seqデータのマッピング2
さて、いよいよマッピング。
paired-endの1サンプル分をマッピングします。
コマンド STAR --runMode alignReads --genomeDir ../ref/STAR_reference --readFilesCommand gunzip -c --readFilesIn ../seq/SRR1551011_1.fastq.gz ../seq/SRR1551011_2.fastq.gz --outSAMtype BAM SortedByCoordinate --runThreadN 6 --outFileNamePrefix SRR1551011 --quantMode TranscriptomeSAM
readFilesCommand gunzip -c …FASTQ ファイルが圧縮されている場合、このオプションを指定すると、解凍しながらファイルを読み込む。
outSAMtype BAM SortedByCoordinate ... aligned.sortedByCoord.out.bamファイルを、座標順にソート
--quantMode TranscriptomeSAM ... aligned.sortedByCoord.out.bamファイルのトランスクリプト座標に変換されたアラインメントを出力
STARのオプションはこのマニュアルを参照
STARmanual
finished Successfllyと表示されればOK
たくさんのサンプルを処理する場合は、シェルスクリプトを作って実行したほうが良いと思います。(シェルスクリプトの勉強しようと思います)
次は、STARで出力されたBAMファイルをサンプルごとにRSAMで遺伝子発現の定量をします。
次の記事でRSEMのインストールと発現量の定量を行います。
この記事が気に入ったらサポートをしてみませんか?