見出し画像

家でもできるDNA解析!準備編

前回の「家でもできるDNA解析」の続きになります。目標は系統樹をつくることなのですが、全部を一度に書くと長くなるので、準備・作製・解説と3つに分けて紹介します。これから書く内容は、お手軽にできる実験とは言いがたいです。しかし、必要な道具はPCだけで、作業も困難でないことから、ここで”自宅でできる”という定義に当てはまると考えています。なるべく容易な言葉で説明していこうと思います。

おススメの遺伝子

系統樹を作るにあたって、前回紹介した方法で塩基配列をダウンロードする必要があります。例えば、脊椎動物の系統樹を作るのであれば、「メダカ、サンショウウオ、ウミガメ、ニワトリ、ネズミ」に加えて、脊椎動物に近い生き物(ホヤやナメクジウオ)などの遺伝子をダウンロードしておきましょう。
ただ、ダウンロードする時に遺伝子の名前を注意して下さい。NCBIで学名検索すると、同じ学名の塩基配列データがたくさん出てきますが、遺伝子の名前が異なっていることがあります。ここでは、私が系統樹を作る時によく使う遺伝子を紹介しておきます。

Aが学名、Bが遺伝子の名前になっています。系統樹は、特定の遺伝子の塩基配列を比較して作るので、遺伝子が異なるとちゃんとした系統樹がかけません。

28S rRNA(16Sとか18Sでもよいが、番号は同じものでそろえて下さい)
例であげたように種類の全く異なる生物で系統樹をつく時によく使用します。この遺伝子はリボソームという生物が生きるために必要なタンパク質を作る時にはたらく遺伝子です。メダカとキンギョの体の色がなぜ異なるかというと、体の色を決める遺伝子の塩基配列が違うからです。しかし、リボソームのような生きるために必要なタンパク質の設計図となっている塩基配列が変化してしまうと、その生物は死んでしまいます。そのため、この遺伝子の塩基配列は種類が全然違う生物同士でも違いが少ないため、比較することができます。

シトクロム(cox1やcytbという略称でよばれます)
電子伝達系に関わる遺伝子なのですが、ここでは説明を省略させていただきます。簡単にいうと、生物学的な“呼吸”の意味は、「酸素を使用してエネルギーを作ること」であり、ここで使用されるタンパク質の1つがシトクロムです。呼吸は生物にとってかかせないことなので、これに関わる遺伝子も変化はしにくいですが、リボソームほどではないことから、種間変異(オオカマキリとハラビロカマキリの違い)を調べる時などに使用します。

ITS(内部転写スペーサー領域)
簡単にいうと意味のない領域です。先述しましたが、塩基配列は1000個の並び方でタンパク質が指定されます。しかし、ここの領域の塩基配列は何も指定していしません。そのため、何かあるとすぐに塩基配列が変化します。西日本のメダカと東日本のメダカの違いというような同種の生物の違いを比較するときに使用されます。

リボソームの遺伝子とシトクロムの遺伝子は同じDNA上にはありませんが、図のように遺伝子の間にITSがあるといったかんじです。

用意するもの

系統樹をつくるために使用する生物の塩基配列が用意できたら、以下のサイトからソフト(アプリ)をインストールしてください。念のために言っておきますが、PCでしか使用できません。タブレットやChromBookでは無理です。あと、全て無料です。

TeraPadというテキストエディターです。使い勝手の良いメモ帳と思ってください。Fastaファイルを開いて、編集するときに使います。

MEGAというDNA解析ソフトになります。WindowsのOSに合わせて7, 10, 11とシリーズがありますが、MacやLinuxでも使用できます。ここでは、7を用いて使い方を説明します。

クリック&ドロップでFastaファイルをTeraPadのアイコンに移動させてファイルをあけます。
こんなかんじで開きます。
ファイルを1つずつ開いて、どこか1つのファイルに塩基配列をまとめてください。
クリック&ドロップでMEGAでひらきます。
こんなかんじで表示されます。
Control+Aで配列を全選択したのち、赤で囲んだ"W"の方を選んで、"Align DNA"を選んでください。
設定画面がでてきますが、とりあえずはデフォルトでよいです。ちゃんとした研究をする場合は、論文の方法を参考にして適切な設定をして下さい。
このように計算されます。このとき、PCのスペックが少々影響します。というのも、1000塩基配列の遺伝子を10個並べ替えることを考えれば、10,000文字を比較することになるので。
両端がずれています。"-"となっているとことには、塩基がありません。下の図のように、塩基がないところは消してください。
消したいところ選んだ後は、右上のハサミとかのアイコンがある列の、❌印をクリックしたら削除されます。
塩基がない"-"を全て消したら、上図のようにData→Export Alignment→FASTA Formatを選んで保存して下さい。

ここで行った作業はアライメントといいます。同じタンパク質でも生物によって設計図の長さは違います。比較するためには、同じ書かれている場所だけを残さないと比較できませんよね。このアライメントという作業を通して、遺伝子という設計図の中の同じ内容とのことだけ抜き出してきたというわけです。

アライメントのイメージはこのような感じです。

いいなと思ったら応援しよう!

この記事が参加している募集