遺伝研~遺伝子予測前のphRAIDER リピート除去~
基本的な使い方
./phRAIDER <input.fasta> <output_dir> [オプション]
• <input.fasta>: 検索したい配列を含むFASTA形式のファイル。
• <output_dir>: 出力ファイルを保存するディレクトリ名。ディレクトリが存在しない場合は新しく作成されます。
オプションの詳細
オプション
-q 出力メッセージを抑制します(静かなモード)。
-p メモリ消費を抑えるプリスキャンモード。少し処理時間が長くなることがありますが、結果には影響しません。
-c 繰り返しとして認識される最小のインスタンス数を指定します。例: -c 5
-mf 入力配列をマスクしたバージョンを指定した名前で出力します。例: -mf masked_output.fasta
-ff GFF形式のフィルタファイルを指定。ここに記載された遺伝子領域と重複する要素は除外されます。
-s PatternHunterスタイルのスペースドシードを指定します。これはアルゴリズムのコア部分ですが、適切なシードの選択についてはまだ研究中です。シードの長さが最小の繰り返し要素の長さを決定します。
実行例
1. 基本実行
./phRAIDER input.fasta output_dir
• 入力ファイル: input.fasta
• 出力ディレクトリ: output_dir
2. 出力メッセージを抑制(静かなモード)
./phRAIDER -q input.fasta output_dir
3. プリスキャンモードで実行
./phRAIDER -p input.fasta output_dir
4. マスクされた配列の出力を指定
./phRAIDER -c 5 input.fasta output_dir
出力について
• /elements: 検出されたすべての繰り返し要素のリストが保存されます。
• 他のファイルは追加情報や解析結果を含みます。