RSEMで遺伝子発現の定量をします
RSEMをRSEM (RNA-Seq by Expectation-Maximization)からダウンロードします。(toolsディレクトリに入れます)
コマンド tar -zxvf RSEM-1.3.3.tar.gz
解凍が終わったら、インストール
コマンド make install
RSEMもインデックスファイルを作ります。
まず、RSEM_referenceディレクトリを作って
コマンド ../tools/RSEM-1.3.3/bin/rsem-perpare-reference --num-threads 6 --gtf Homo_sapiens.GRCh38.95.gtf Homo_sapiens.GRCh38.dna.primary_assembly.fa RSEM_reference/RSEM_reference
これでインデックスファイルが完成。
発現量を定量します。
コマンド ../tools/RSEM-1.3.3/rsem-calculate-expression --num-threads 4 --paired-end --bam ../tools/SRR1550989Aligned.toTranscriptome.out.bam ../ref/RSEM_reference/RSEM_reference SRR1550989
1サンプルごとに実行しましたが、ここもシェルスクリプトを作っておくと便利だと思います。
出力されたgenes.resultsファイルとisoforms.resultsファイルに発現量に関連するスコアが記述されているのでこれを使ってRなどでデータの処理が行えるそうです。