茜色の教室と食中毒 3 -進化系統樹ってなんだい?編-
「須藤君」
「やあ、片山さん。どうしたの?」
「なにしてるの」
彼は黒板になんか書いていた。
「このまえ出てた分類の話で遺伝子の塩基配列を比較する方法の話をしたでしょ」
「ああ、あの」
私はトラウマを掘り起こされた。正直彼の飲み物に毒物を入れなきゃ気が済まない。
そんな私にお構いなしに彼は言う。
「生物はみんな共通の祖先があるんだよ」
「さっきの話にでたやつね」
「でね、その『共通祖先が持っていた遺伝子』は今もほとんどの生物に保存されている」
少し頭がさえてきた。
「それが前に言ってた16Sなんたら?」
「そう。なんだ、片山さん。さえてきたね」
私は少し得意げになった。
「16S rRNAはリボソーム、つまりタンパク質を作るための細胞の中にある器官の一部だ。すごく大事な部分だから、どんな生物も持ってる遺伝子だよ。真核生物では18Sって呼ばれているけど、役割は一緒。でその16S rRNAをコード、記録しているDNAの配列を比べることで生物の分類をするんだ」
「あれ?どんな生物でも持っているなら比べてもしょうがないじゃん。だって同じものを持っているんでしょ?」
「これが違うんだよ。正確には『ちょっとずつ違う』。遺伝子もといDNAの配列は紫外線とか複製するときとか、そういう要因でちょっとずつ変化していく。『ちょっとずつ変化していく』っていうのがミソだ。もともとは同じものだったとわかるぐらいに原型は留めているけれど、どんな差があるかを比べられるくらいには変化している」
「じゃあ、その差を比べてるんだ」
「そして重要なのはこの遺伝子の距離の差は進化の履歴を示していることだね」
「でもさ、その遺伝子の差を見るってのは分かったけれど、どうしてそれでグループ分けできるの?」
「階層的クラスタリング」
「そこが分からないんだってば」
「これもさっきの分類の話に近いんだけれど。遺伝子の差、まあ配列の違いのことなんだけれど、これって距離で表せられるんだ」
「距離…」
「例えば、AAAとATAって配列があったとする。この二つの違いは真ん中の文字がAかTかだけだ。だからこの二つの配列の間の距離は1となる」
「えっと、結構おおざっぱなんだね」
「もちろん一例だよ。この距離を計算する方法はたくさんある。で、系統樹を書きたい生物の配列の『すべての組み合わせの遺伝子の距離』を算出して、距離が近いものから順番にまとめていく。するとこんな風な系統樹ができる」
須藤君は黒板に絵を描いた。
「これでこの系統樹でどの生物が似た者同士かがわかる。正確に言えばどの生物の塩基配列が似ているかグループ分けできる」
「うーん。あんまりついていけてないな…」
「これ結構難しい話だからね…。もし興味あったら入門書を読んだ方がいいかも※」
「でも須藤君は理解しているんでしょ?」
「してる」
「腹立つんだよなー全体的に」
「全体的に!?」
<適当につづく>
筆者脚注
※『進化で読み解く バイオインフォマティクス入門』長田直樹著がおすすめです。