FASTAファイルを染色体ごとに分割するPythonスクリプト:split_fasta.py
FASTAファイルを染色体ごとに分割するPythonスクリプト
NGS解析や遺伝子解析を行う際、FASTAファイルを染色体ごとに分割したい場面が多々あります。そこで、Pythonを使って簡単に染色体ごとにFASTAファイルを分割し、元のディレクトリに出力するスクリプトを作成しました。
このスクリプトは、染色体(または配列)ごとに分割し、以下の形式で出力します:
<元のファイル名>_chr<染色体ID>.fasta
python split_fasta.py /path/to/input.fasta
• 入力ファイル名がgenome.fastaの場合、以下のようなファイルが出力されます:
genome_chrchr1.fasta
genome_chrchr2.fasta
genome_chrchr3.fasta
...