アミノ酸文学 (Amino acid literature)のすゝめ
研究としてではなく、創作としてアミノ酸の一文字表記の羅列で文章を作成しようという話。
ある朝のこと
大学院生のAは、実験の進捗を確認するため、いつもより早く研究室に向かった。研究室に入ると、床に倒れている高齢の教授Bを見つける。驚きながらも教授Bの脈を確認すると、幸いなことにまだ生きているようだ。しかし意識はない。急いで救急車を呼び、教授Bは病院に運ばれた。
研究室に戻ったAは、教授Bが倒れていた場所の周囲を調べ始める。そこにはDNAサンプルの入った小さなチューブと、殴り書かれたメモが落ちていた。メモには、特定のプライマーの管理番号が記されており、それを使ったPCRの条件が簡潔に書かれていた。
「これは…B先生が何かを伝えたかったのか?」
疑問を抱きつつも、Aはメモ書きの指示に従い、PCRを試みることにした。いつも通りに反応をセットし、サイクルを回す。そして電気泳動の結果を確認すると、特定のサイズのDNAが見事に増幅されていた。
増幅されたDNAの配列を解析すると、以下のような配列が取得された。
Aはこの塩基配列が翻訳可能であると踏み、アミノ酸配列に翻訳してみることにした。そこには思いもよらない結果が待っていた。
※本文章はChatGPTを用いて制作されました。
はじめに(基礎知識)
皆さん、「暗号」は好きですか?
幼いころにヒエログリフやルーン文字のローマ字表記で文を作ってみたり、もしくは『HUNTER×HUNTER』のハンター文字のような簡単な文字置換型のものを試して遊んだ人もいると思います。今回はそんな文字置換型の暗号です。(ガチ暗号は出てきません)
ちなみに私はS&Mシリーズやガリレオが好きでミステリーに理系要素が出てくるとワクワクします。しませんか?
我々生命(少なくとも現在の地球上の)は、DNAに含まれる4種類の核酸塩基(A: adenine, T: thymine , C: cytosine, G: guanine)を用いて遺伝情報が保存されています。この遺伝子の情報が、転写・翻訳の過程を経て、実際に生体内で機能するタンパク質が合成されるセントラルドグマの話は省略しますが、4種類の核酸塩基の配列がタンパク質を構成するアミノ酸の配列を対応付けているのが遺伝暗号(コドン)です。(タンパク質に翻訳されるmRNAにはTの代わりにU: uracilが使われる。)
コドンでは塩基配列3組を1単位として1つのアミノ酸を決定しています。
例:ATG→メチオニン(Met/M)
1つのアミノ酸に対して数種類のコドンが対応しており、これは現存するすべての生物(細菌やアーキア、真核生物すべて)で共通しています。(どのコドンを良く使うかは生物ごとに変わりますが)
コドン表|ベクタービルダー
また、コドンによって決定された各20種類のアミノ酸には略号があり、三文字または一文字で表記されます。
一文字表記はタンパク質のアミノ酸配列を表記したいときなど、短く扱いたいときに使用されます。
アミノ酸略号 | 製品情報 | ナカライテスク株式会社
ここで、塩基配列とアミノ酸配列との対応を見てみましょう。下に示しているのは、牛乳に含まれるタンパク質(カゼイン KEGG T01008: 281099)の元となる(コードすると言います)塩基配列です。まさに暗号です。
この並びをコドン表に当てはめて翻訳していくと、以下のアミノ酸配列が出来上がりました。
※人力でやるのは大変なので塩基配列翻訳ツールを用いましょう。
・塩基アミノ酸翻訳ツール | 西田コンピューティングサービス
・塩基配列からアミノ酸配列への変換ツール
などなど…
この出来上がったアミノ酸の鎖が折りたたまることで構造が出来上がり、
タンパク質としての機能を発揮するわけです。
※参考にしてください→:03 タンパク質の構造と機能
アミノ酸を文字として使う
ここまでで遺伝情報という暗号が読み解かれて、アミノ酸配列・タンパク質ができる過程を見てきましたが、今回は暗号を作ることが目的なので、
「アミノ酸配列を塩基配列に変換」することで良い暗号が作れそうですね。
では、さっそくアミノ酸を文字として使っていきたいのですが…
ここで一つ問題があります。
そう、タンパク質を構成するアミノ酸は20種類なので、
この暗号文にはアルファベットが20種類しか使えないということ!
具体的には「B, J, O, U, X, Z」の6文字が使えません。
母音が2つも使えないのが手痛い。
したがってアミノ酸の一文字表記を使った文は6文字のアルファベットが使えないという制約を受けたリポグラムということになります。
西尾維新の『りぽぐら! 』並みの超絶技巧が必要なんでしょうか??
創作としての例
毎年良くあるのが「MRRYCHRISMAS」と「HAPPYNEWYEAR」です。
生命科学系の方の投稿でよく見るもので、文字の制約も受けていないので簡単にできますね。しかも塩基配列を表記し、投稿を見た人に翻訳を促しています。暗号は解かれるために存在する。
実践してみよう!
まずは、文章を作成しましょう。使える単語リストをウェブ英単語事典から「B, J, O, U, X, Z」の6文字を含む単語を除きました。参考にしてください。
GPTに投げてやるとこんな感じになりました。幸先良さそうですね。
もっと長い文章を作成してみましょう。
新年の挨拶を考えてもらいました。
アミノ酸配列としては155残基とまぁまぁ小さいけどいい感じのタンパク質の大きさになりそうな配列が完成しました。
とりあえず立体構造を予測してみましょう。(AlphaFold Server)
ヘリックス構造が部分部分で出来上がっていて中央でハートみたいになって見えるのがなんとも可愛いですね。配列だけでなく、タンパク質の構造にも情報を持たせた複雑な暗号を作ることも可能かもしれません。
この配列をコドン表にならって塩基配列に直していきましょう。
1つのアミノ酸を決定するのにはだいたい複数のコドンがあるので、全部バラバラにするのか、実際に生物に組み込むことを想定してコドン頻度を調製して作成するのかは、暗号作成者と腕の見せ所ですね。
このように文章を綴っていけば、最終的に「アミノ酸文学」と呼べるような作品がいつか生み出されるかもしれません。
これを読んだあなたか、別の誰かか。
最後に
今回は創作の一要素として遺伝暗号を用いた文章・アミノ酸文学についてまとめました。
分子生物学的な要素は良く創作のモチーフになったりしています。ただ、塩基配列・アミノ酸配列がその生物化学的特性から生物学的な意味・意義から離れにくく、昨今の技術進歩により新しい情報の記録媒体としての利用や人工的な機能を持つ酵素の開発などが行われるようになりました。それらから解き放たれてただの創作物となるというのにはもう少し時間がかかるのかもしれません。
最近驚いたこととして、未視聴の方にはネタバレになってしましますが、アニメ『機動戦士ガンダム 水星の魔女』22話にて、重要なコードがトマトの中に遺伝暗号として隠されてました。
詳しい解説はこちら
『水星の魔女』のトマトのメッセージはDNAバーコーディングの応用かもしれない|しましょ@サイエンスライター穏健派ゆるふわ系
上段に出てきたメッセージ、下段にその時ときに映し出された塩基配列から翻訳されたアミノ酸配列を示しています。
>I_wii_always_be_attaced_to_you,_Miorine. VRPRSSRKSPKRQRNTRKHHKKTTNRHMRRMPLRY
母が娘に遺した感動的なメッセージですが、
アミノ酸配列が文章になっていたわけではなかったです。
しかし、このように「誰かに読んでもらう文章」として遺伝暗号が用いられたというのがとても画期的だと思いました。(感想)
分子生物学に触れているものとして、
こんな自由な創作が増えると面白くなりそうですね。
さて、冒頭の教授Bは何を伝えたかったのでしょうか。
ある晩のこと
Aの予想通り、塩基配列は翻訳可能な形式で並んでおり、それをアミノ酸配列を一文字表記で文章とすると以下のメッセージが現れた。
Aは混乱しながらも、このメッセージが単なる偶然の産物ではないことを確信する。教授は意識を失う直前、自分の手でこれを仕掛けたに違いない。だが、なぜDNAという形でメッセージを残したのか?研究データを狙うものがいるのか?
その日から、Aは研究室内で微妙に異変を感じ始める。誰かが実験台の配置を動かしているような気がするし、夜遅くに残っていると、不審な物音が聞こえることもあった。
ある晩、Aが深夜まで研究室に残っていると、セキュリティカードを使わずに研究室の扉を開けようとする影が映る。慌ててライトを消し、身を潜めたAは、侵入者の行動を見張ることに。
侵入者が教授Bのデスクの引き出しを物色している様子をAは捉えた。
Bが残したDNAメッセージは単なる警告ではなく、ある決定的な証拠も含まれていた。侵入者が何者なのかを特定するための重要な手掛かりだったのだ。教授が事前に気づいていた「裏切り者」の正体が、徐々に明らかになっていく。(続きは書きません)
※本文章はChatGPTを用いて制作されました。