見出し画像

情報で捉える生物学入門#3 【分子生物学】

生物は遺伝子の乗り物である、そんな話を第1回の連載でした。情報を次世代にバトンタッチするためには、情報をコピーする必要がある。これはDNAの複製と呼ばれる過程であり、DNAの構造と密接に関連している。


複製

DNAは糖(デオキシリボース)、4種類の塩基(アデニン、チミン、グアニン、シトシン)、リン酸から構成されるデオキシリボースがホスホジエステル結合により連結してできている。この4文字で生物はゲノム情報を表現しているため、生物は4進数を採用しているとみなせる。アデニンとチミン、グアニンとシトシンはそれぞれ2本と3本の水素結合により相補的な塩基対を形成し、DNAは鎖が2つよりあった2重らせん構造をとる。このDNAの相補的塩基対と2重らせん構造は、一方のDNA鎖があればもう一方の鎖を完全に復元できることを意味している。実際に細胞内ではDNAポリメラーゼという酵素が1本鎖DNAを鋳型にしてもう一方のDNA鎖を合成しており、これを半保存的複製という。その意味で生物は常に2コピーの遺伝情報を保持しており、これは誤りの訂正という観点からはかなり冗長な情報の保持の仕方といえる。しかし、物理的に近接したもう一方の鎖を見れば他方を完全に再現できるという性質が遺伝情報の複製や変異修復の過程で重宝されているため、2重らせん構造が採用されているのだろう。

セントラルドグマ

生物のゲノム情報はDNAに格納されている。しかし、情報だけでは生物は生きていけない。生物が物理的な世界を生き抜くためには、情報を物質として機能する構造に変換するプロセスが必要である。生物において、構造・機能を担うのがタンパク質であり、DNAに刻まれた遺伝子がタンパク質へと発現する過程をセントラルドグマと呼ぶ。セントラルドグマについては以前も解説したが、DNAが核内でRNAポリメラーゼによってRNAという別の核酸に転写され、RNAが細胞質でリボソームによってタンパク質へと翻訳される過程である。

転写

RNAは糖、4種類の塩基、リン酸から構成される点はDNAと共通だが、糖にリボースを、塩基にA,G,Cとウラシル(U)を用いる点が相違点である。RNAは原則的に1本鎖で、DNAより不安定である。主なRNAとしてはDNAから転写されてタンパク質の設計情報を持つメッセンジャーRNA(mRNA)、翻訳の際にリボソームに遺伝情報と対応するアミノ酸を運ぶトランスファーRNA(tRNA)、リボソームを構成しアミノ酸伸長の反応を触媒するリボソームRNA(rRNA)が存在する。

DNAからRNAへの遺伝子の転写は、RNAポリメラーゼがDNA上の遺伝子の前に存在するプロモーター配列に結合することで開始する。原核生物は転写されたmRNAがそのままタンパク質の翻訳に使われるのに対し、真核生物では転写後配列内のイントロンを除去してエキソンを連結するというスプライシングや各種修飾反応がおこり、核外に輸送されてから翻訳が始まるため、転写と翻訳が時間的にも場所的にも分離されているという違いがある。また、スプライシングの過程では常に同じエキソンが選ばれるのではなく、複数のエキソンのうち一部のエキソンのみ選ばれるという選択的スプライシングも起こっており、ヒトの約2万のタンパク質をコードする遺伝子から10万のタンパク質産物が生産されるという多様性の創出メカニズムにもなっている。

翻訳

RNAからタンパク質の翻訳では、4進数で記載されたRNAの遺伝情報を20進数のアミノ酸配列情報に変換する必要がある。(生物が合成できるアミノ酸の種数が基本的に20種。)ここでは、mRNAの連続する3つの塩基をコドンと呼ばれる1つの塊として、それを1つのアミノ酸と対応させるコーディング戦略がとられている。塩基3つ組4つで指定できる組み合わせの数は$${4^3=64}$$のため、20種類のアミノ酸と、翻訳の開始や終了のシグナルの指定に十分である。逆に、20種類のアミノ酸に対応させるために3つ組の塩基をまとめて1つのアミノ酸に対応させるという暗号を生物は進化させたといえる。

オペロン機構

生物は環境の変化に迅速に対応するために遺伝子発現を変化させていく必要がある。つまり、すでにある情報の中からどれを活用するかを選択することが生存に重要である。ここでは、最も基本的な遺伝子発現制御方法である原核生物における転写制御であるオペロン機構を解説する。オペロンとは関連する遺伝子群がまとめて転写される単位であり、共通のプロモーターとオペレーターで制御される。プロモーターはRNAポリメラーゼが結合する転写開始点、オペレーターはリプレッサータンパクが結合する転写のオン・オフを切り替える配列、リプレッサーはオペレーターに結合して転写を抑制するタンパク質である。

例として、グルコース非存在下・ラクトース存在下でのみラクトース関連遺伝子の発現を可能にするラクトースオペロンを説明する。環境内にグルコースが存在すると、グルコースが優先的に利用され、cAMPの濃度が低くなることで、cAMP-CAP複合体形成とプロモーターへの結合による転写促進が起こらない。ラクトースが存在すると、ラクトースの代謝産物がリプレッサーに結合し、リプレッサーの構造が変化してオペレーターから外れる。これにより、RNAポリメラーゼがプロモーターに結合して転写を開始することが可能になり、ラクトース関連遺伝子が発現するという仕組みになっている。この動作は、Python風疑似コードで以下のように記述できる。

def lac_operon_activity(lactose_present, glucose_present):
    """
    ラクトースオペロンの働きをシミュレートする関数

    Args:
        lactose_present (bool): ラクトースが存在するか
        glucose_present (bool): グルコースが存在するか

    Returns:
        str: Lacオペロンの状態
    """
    # 初期状態: オペロンは抑制されている
    operon_active = False
    transcription_level = "None"  # 転写レベル ("None", "Low", "High")

    if not lactose_present:
        # ラクトースがない場合、リプレッサーがオペレーターに結合し抑制
        transcription_level = "None"
    else:
        # ラクトースがある場合、リプレッサーは不活性化
        if glucose_present:
            # グルコースがある場合、cAMP-CAP複合体が形成されず、低い転写レベル
            transcription_level = "Low"
        else:
            # グルコースがない場合、cAMP-CAP複合体が形成され、高い転写レベル
            transcription_level = "High"

    # 結果を返す
    return f"Lac Operon Activity: {transcription_level}"


# 動作確認
scenarios = [
    {"lactose_present": False, "glucose_present": True},
    {"lactose_present": True, "glucose_present": True},
    {"lactose_present": True, "glucose_present": False},
    {"lactose_present": False, "glucose_present": False},
]

for scenario in scenarios:
    result = lac_operon_activity(
        scenario["lactose_present"], scenario["glucose_present"]
    )
    print(f"Lactose: {scenario['lactose_present']}, Glucose: {scenario['glucose_present']} -> {result}")

このコードを実行すると、以下のような結果が得られ、ラクトースオペロンという名の細胞内の論理回路の動きをシミュレートできる。

Lactose: False, Glucose: True -> Lac Operon Activity: None
Lactose: True, Glucose: True -> Lac Operon Activity: Low
Lactose: True, Glucose: False -> Lac Operon Activity: High
Lactose: False, Glucose: False -> Lac Operon Activity: None

DNAの複製は高速であり、原核生物では1秒間に最大1000塩基の伸長するとされている。一方で、複製ミスは$${10^8\sim10^{10}}$$塩基に1つ程度と極めて正確である。いかに生物がゲノム情報を早く正確に伝えるために最適化されているかがうかがい知れる。タンパク質の翻訳でも$${10^{-4}}$$程度の正確性を達成していることが知られており、これは本来は$${10^{-2}}$$程度のミスの確率を一見無駄な不可逆的反応を入れることで精度を高める動力学的校正という仕組みが働いていることが知られている。

なぜRNAは必要なのか?

最後に、なぜ情報の発現の途中にRNAという中間体が必要なのか、について考えてみたい。

日本最古の物語文学である竹取物語の原本と証明されたものが見つかったとしよう。これは言うまでもなく情報としての価値が高いものであるので、紛失・劣化しないように厳重にしまっておきたい。一方で、価値が高いからこそ、どのようなかぐや姫像が描写されているのか、多くの人の目に触れるべきものでもあり、持ち出して最大限に活用したい。つまり、ここには価値の高い情報におけるトレードオフが存在する。解決策はもちろん原本は厳重に保管しておきながら、写真を撮ってネット上でばらまくことである。つまり、1つしかない大切な情報は安全な場所にしまっておきながら、ある程度書き換えられてもかまわない媒体へと情報をコピーし、広く分配することで情報を最大限に活用するのである。もちろん、ここでの情報が生命の設計図であるゲノム情報であり、多少不安定だがコピー数が多く、核外に運ばれてタンパク質作成のベースとなる情報のコピーがRNAである。RNAはゲノム情報を守りつつ活用するために必要なのである。

参考文献

前の連載記事

次の連載記事

生物は遺伝子の乗り物であり、遺伝情報を次世代に伝えるためにDNAの複製が行われる。DNAの相補的な2重らせん構造により、一方の鎖からもう一方の鎖を再現することができる。情報を物質として機能する構造に変換するプロセスには、DNAからRNA、RNAからタンパク質への転写と翻訳があり、RNAは不安定だが遺伝情報を活用するために重要な中間体である。

ChatGPTを用いて要約
サムネイル画像はDALL-Eにより生成

この記事が参加している募集