シロイヌナズナの遺伝子名、AGIコードについて
シロイヌナズナ(Arabidopsis thaliana, イタリック体で表記)は、モデル植物として植物科学の研究で一般的に利用されている植物です。
シロイヌナズナには、植物体のサイズが小さいので実験室で沢山の植物を栽培できる、2ヶ月程度で種子が取れるので世代交代が早い、自家受粉で増えるので遺伝学に都合がよい、形質転換の効率が高いので変異体の相補実験が容易などの特徴があります。
2000年に国際コンソーシアムによって全ゲノム塩基配列が決定され、それら遺伝情報は他の植物のリファレンス配列としても利用されています。
また、数多くの変異体、cDNA、BACクローン、遺伝子発現情報などの研究用のバイオリソースも充実しています。
ここでは、シロイヌナズナの遺伝子表記の基本的なルールについて説明します。
遺伝子名や変異体の表記の仕方などは、バクテリア、酵母やマウスなど生物種によって異なるので注意してください。
まず、シロイヌナズナの遺伝子は一般的には、アルファベット3文字+数字で表記されます。
例えば、シロイヌナズナのPSEUDO-RESPONSE REGULATOR 5は「PRR5」と表記されます(遺伝子名はイタリック体)。
但し、このルールは全ゲノム塩基配列が決定された前後に一般的になったので、それ以前に単離された変異体や遺伝子名など、例外もあります。
例、FLOWERING LOCUS T (FT)、FLOWERING LOCUS C (FLC)、GIGANTEA (GI)、PHOTOTROPIN 1 (PHOT1)など。
複数の研究グループによって単離された遺伝子は、複数の名前がついていることもよくあるので注意してください。
論文を書くときなどは、最初に名前をつけた人の表記に従うのが、一般的な科学のお作法でしょう。
すべての遺伝子にはAGIコードがついています。
例えば、PRR5にはAt5g24470といったAGIコードがつけられています。
At, シロイヌナズナ
5, 5番染色体
g, ゲノム染色体
24470, 2447番目。
最後の5桁の数字については、ゲノムデータベースが出来上がった時点での推定遺伝子の順番に、各染色体の5'末端から、00010、00020と10刻みに番号が振られました。
データベースが更新された際に新しくアノテーションされた遺伝子については、00045、00057、といった1のくらいに0以外の番号が振られています。
また、オルターナティブスプライシングによるスプライシングバリアントがある場合や、最初のアノテーションと異なるORFで遺伝子が予測された場合などは、「.1」「.2」といった番号が振られています。
At5g24470.1
At5g24470.2
これら情報は、The Arabidopsis Information Resouce (TAIR)のサイトで得ることができます。
http://www.arabidopsis.org
また、シロイナズナの遺伝子、変異体などの一般的な表記法として、
遺伝子名は、PRR5(イタリック体)
タンパク質は、PRR5(ノーマル書体)
変異体は、prr5(小文字のイタリック体)
変異体のアリル(異なる変異)は、それぞれ prr5-1、prr5-2(小文字のイタリック体)
といったルールがあります。
これら表記の仕方にも、Phytochrome Bなど、例外があります。
遺伝子名 PhyB(イタリック体)、変異体 phyB(イタリック体)
この記事が気に入ったらサポートをしてみませんか?