【論文を読む-3】Characterization of Peroxidase and Laccase Gene Families andIn Silico Identification of Potential Genes Involved in UpstreamSteps of Lignan Formation in Sesame
Abstract
ペルオキシダーゼとラッカーゼは植物内での生理作用に関与する酸化酵素で、生物学的および非生物学的ストレスに対する反応と、健康を促進する特殊な代謝産物の生合成をカバーする。これらは (+)-pinoresinolの生合成に関与してると考えられているが、新興油糧作物であるゴマでのこれらの酵素の包括的な調査はなされておらず、また (+)-pinoresinolの合成酵素に関する情報は今のところ入手できない。この研究ではゴマの多様な種に対してトランスクリプトームプロファイリングを組み合わせることでペルオキシダーゼとラッカーゼのゲノムワイドな特定を行いました。その結果ゴマのペルオキシダーゼおよびラッカーゼ遺伝子をコードする遺伝子として、それぞれ83および48遺伝子が同定された。そのタンパク質ドメインとベイト(※1)として用いたシロイヌナズナ遺伝子に基づいて、遺伝子はそれぞれペルオキシダーゼ遺伝子とラッカーゼ遺伝子の9つのグループと7つのグループに分類された。遺伝子の発現は、エリート品種1種、白種子品種と黒種子品種、高油分品種と低油分品種を含むゴマ6品種の動的トランスクリプトームシーケンスデータを用いて評価した。2つのペルオキシダーゼ遺伝子(SiPOD52とSiPOD63)と2つのラッカーゼ遺伝子(SiLAC1とSiLAC39)は、ゴマ汎ゲノム内でよく保存されており、種子中の(+)-pinoresinol蓄積の動態と一致するゴマ品種内で一貫した発現パターンを示すことから、潜在的な(+)-pinoresinol合成酵素遺伝子として同定された。 候補遺伝子のシスエレメント(※2)から、発生、ホルモンシグナル伝達、光や他の生物的トリガーへの応答への関与の可能性が明らかになった。プロモーター領域の転写因子濃縮分析では、MYB結合配列が優勢であることが示された。本研究で得られた知見は、食品、健康、医薬の分野で幅広い応用の可能性を持つ、ゴマのリグナン指向工学への道を開くものである。
※1
タンパク質断片を餌として,それと相互作用するタンパク質,あるいはタンパク質断片をライブラリー中からスクリーニングするが,この時,餌となるタンパク質側を「ベイト」と呼び,釣られるタンパク質側を「プレイ(prey):餌食」と呼ぶ.
※2
同一分子上の遺伝子発現を調節するDNA またはRNA の領域を指す。転写調節因子はタンパク質である転写因子と遺伝子側のプロモーター領域などに分けれらるが、転写因子側は同じ場所に留まらずトランス(trans)に作用する一方でプロモーター領域側は常に同一分子内にとどまるのでシスと呼ばれる。
1.Introduction
ゴマ科のゴマ(Sesamum indicum L.)は、種子中に(+)- sesamin、(+)-sesamolin、(+)-sesaminolなどのリグナンを含む油糧作物である。神経変性疾患、前立腺がん、乳がんに対するセサミン・リグナンの治療効果が報告されている。さらに、リグナンは機能性食品や栄養補助食品として、ヘルスケアや疾病予防の新たな視点となっている。リグナン市場は爆発的に拡大しており、食品、製薬、化粧品業界をカバーする複数の用途で、2028年までに6億1000万米ドル以上に達する可能性がある。一方、ゴマからのリグナンの抽出、精製、形質転換に関する特許もいくつか登録されており、この植物特有の代謝産物への関心が高まっていることを示している。
現在までに、野生種(S. alatumおよびS. radiatum)および栽培種(S. indicum)を用いて、ゴマのリグナン生合成経路を解明するために多大な研究が行われてきた。ゴマのリグナン生合成に関与する酵素は、2つのシトクロムP450コード遺伝子(CYP81Q1およびCYP92B14)、および4つの糖転移酵素(UGT71A9、UGT94D1、UGT94AG1、およびUGT94AA2)を含む、合計6つの酵素が同定されている。同定された酵素とそれぞれの標的との関連を図1に示す。リグナン生合成経路の最初の段階で、2分子のコニフェロールアルコールが関与する酸化的カップリング反応が起こる。dirigent protein(DIR)の助けを借りて、リグナンの一次前駆体である(+)-pinoresinolが生成される。その後、後者はCYP81Q1によって順次変換され、(+)-piperitoと(+)-sesaminを生成する。さらに、(+)-sesamolinと(+)-sesaminolの合成はCYP92B14によって誘導される。
中心的な前駆体である(+)-pinoresinolの合成機構には、オキシダーゼ酵素(ラッカーゼおよび/またはペルオキシダーゼ)とディリゲンタンパク質の複合作用が関与している可能性が非常に高いことは言及に値する。ペルオキシダーゼおよび/またはラッカーゼによる酸化と、それに続くディリゲンタンパク質の誘導による立体選択的なラジカルカップリングは、すべての植物リグナンの合成の初期段階で起こると推測されている。簡単に説明すると、コニフェリルアルコールの一電子酸化は、過酸化物および/またはラッカーゼによって触媒される。その結果、中間分子であるコニフェリルアルコール(1)由来のフリーラジカルが生成する。その後、ディリゲンタンパク質によって誘導される分子内環化反応によって、(+)-pinoresinol分子が形成される。
我々の知る限り、ゴマのリグナン生合成の重要な前駆段階に関与するオキシダーゼ活性の証拠はまだ確立されていない。配列の相同性により、ゴマからdirigent protein質(XP_011080883)が検出されたが、その機能の証明と、コニフェリルアルコールから(+)-pinoresinolへの変換を担うペルオキシダーゼまたはラッカーゼの正体は、まだ確立されていない。
ペルオキシダーゼとラッカーゼは、植物において生物学的応答と生物学的応答、および繊維形成、細胞伸長、リグニン化、種子結実と分枝、色素沈着、フラボノイド酸化などの生物学的プロセスをカバーする幅広い役割を果たす多機能酵素である。ペルオキシダーゼやラッカーゼは、治療や工業的用途にも用いられている。例えば、ペルオキシダーゼは工業的な化学合成、診断テスト、酵素免疫測定に使用されている。一方、ラッカーゼは脱リグニン能があるため、製紙産業において非常に重要である。さらにラッカーゼは、エタノール生産、ワイン清澄化、工業廃水処理、除草剤分解、染料脱色、薬物分析にも有用である。
植物におけるペルオキシダーゼとラッカーゼの重要性に鑑み、本研究はゴマにおけるこれらの酵素の特徴を包括的に明らかにし、リグナン生合成の初期段階に関与すると考えられる候補遺伝子を概説するために実施された。
2.Materials and Methods
2.1.Genome-Wide Identification of Peroxidase and Laccase Genes and Core Genes Inference
S. indicum var. Zhongzhi13などのゲノムデータからペルオキシダーゼとラッカーゼの推定遺伝子を検索した。
NCBI HMM アクセッション TIGR03390.1(EC1.10.3.2)はラッカーゼ遺伝子の同定に使用され、PFAM HMM アクセッション PF00141.26 はラッカーゼ遺伝子の検出に使用された。
ラッカーゼ遺伝子の同定には NCBI HMM アクセッション TIGR03390.1 (EC 1.10.3.2)を、ペルオキシダーゼ遺伝子の検出には PFAM HMM アクセッション PF00141.26 を用いた。hmmsearch (-E 1 × 10-5-domE 1 × 10-5 ) を用いてヒット検索を行った後、PfamScan v1.6を用いてドメイン検証を行い、POD (peroxidase) ドメインと LAC (laccase) ドメインの存在を確認した。偽遺伝子は除外された。PODドメインとLACドメインの存在の追加チェックは、InterProScan v5.を用いて行った。
ゴマのパンゲノムデータセット内のコア保存POD遺伝子とLAC遺伝子を推定するために、Orthofinder v2.3.12をデフォルト設定で実行した。S. indicum var Zhongzhi13の参照ゲノムから同定されたPOD遺伝子とLAC遺伝子は、下流の解析のために保持された。
2.2. Chromosome Location and Syntheny Analyses
SiPOD(ペルオキシダーゼ遺伝子)およびSiLAC(ラッカーゼ遺伝子)のゲノムマッピングは、アノテーション情報に基づいてMG2C V2.1を用いて行った。ゴマ-ゴマ間およびゴマ-アラビドプシス間のシンテニーブロックはMCScanXツールキットを用いて調べた。重複遺伝子の進化的起源については、MCScanXの重複遺伝子分類Perlスクリプトにより、タンデム重複またはセグメント重複により進化した遺伝子を区別することができた。
2.3. Phylogenetic Analysis
A.thalianaのペルオキシダーゼ遺伝子とラッカーゼ遺伝子をSiPOD遺伝子とSiLAC遺伝子に加え、系統樹を構築した。系統樹の推論に先立ち、MAFFT v7.464-0を用いて遺伝子のアラインメントを行った。得られたアライメントはtrimAl v1.4.1 でトリミングした。その後、IQ-TREE v1.6.12を用いてツリーを構築した。ペルオキシダーゼおよびラッカーゼの最尤樹は、それぞれモデルLG+R5およびLG+I+G4に従って1000回反復して推論した。樹木モデルはModelFinderパッケージを用いて選択した。
2.4. RNA-Seq Data Retrieval
ペルオキシダーゼおよびラッカーゼ遺伝子の発現を調べるために、6 種類のゴマ品種 (Zhongzhi13, Zhongfengzhi No.1, Zhongzhi No.33, ZZM4728, ZZM2161, and ZZM3495)を RNA シークエンシングデータを用いて選抜した(表 S1)。選抜の基準は、(a)油分含量(高油分生産品種と低油分生産品種)、(b)種子色(白色と黒色)であった。そこで、参照ゲノムZhongzhi13の多臓器トランスクリプトームデータに加えて、それぞれ白色と黒色の種子色を示すゴマZhongfengzhi No.1とZhongzhi No.33の2つの純系統の種子RNA-Seqを使用した。高油分(59.1%)の1品種(ZZM4728)と低油分の2品種ZZM2161(48.4%)とZZM3495(51.0%)の種子トランスクリプトーム配列もNCBIからダウンロードした。これらのゴマ品種は、中国湖北省武漢市の油糧作物研究所(OCRI)実験ステーション(北緯 30.57 度、東経 114.30度、標高 27m)で同一の生育条件下で栽培された。RNAサンプリングは、ZZM2161、ZZM3495、ZZM4728については発芽後10、20、25、30日目に、中風子1号および中風子33号については発芽後5、8、11、14、17、20、23、26、30日目に行った。材料およびRNA-Seq生データSRAに関する詳細情報は表S1に示す。
2.5. Expression Profile Analysis and Candidate Genes Selection
RNA-Seqの生データはFastQC v0.11.2を用いて品質チェックを行った。シーケンスアダプターおよび低品質(Q < 30)リードは、Trimomatic v0.36を用いてフィルタリングした。その後、HISAT v2.2.1を用いて、クリーンデータを参照ゲノムにマッピングした。各組織における遺伝子発現プロファイルは、RSEMパッケージv1.3.3を用いて、マッピングされた100万フラグメントあたりの転写産物1キロベースあたりのフラグメント数(FPKM)として評価した。異なる組織での発現を示すヒートマップは、TBTools v1.098746を用いてlog2(FPKM)値でプロットした。
候補遺伝子を選択するために、3つの主要なフィルター基準を適用した。第一に、リファレンスゲノムデータセットから、根、葉、茎、莢膜に比べて種子組織で優先的に発現する遺伝子を選んだ。第二に、第一のフィルタリング・ステップで得られた候補遺伝子は、高油分品種と低油分品種における発現をチェックし、特に種子形成の初期に発現する遺伝子に重点を置いた。ピノレシノールはゴマ中のすべてのリグナンの前駆体であるため、初期段階の基準が含まれた(図1)。さらに、Onoらによって報告されたピノレシノールの生合成の速度論は、種子発生の初期段階で発現が増加し、成熟段階で下流のリグナンを種子に後から蓄積できることを示唆していた。第三に、第二のフィルタリングステップの後、同じアプローチを白種子対黒種子のデータセットに適用した。白ゴマ種子には黒ゴマ種子と比較して高レベルのリグナン(セサモリンおよびセサミン)が含まれていることが報告されているため、本研究では種子の色を考慮したことは特筆に値する。
全体として、保持された候補遺伝子は、ゴマ汎ゲノムの中核遺伝子レパートリーに属し、種子組織で優先的に発現し、種子発生の初期段階で強く発現していた。
2.6. Conserved Motifs, Gene Structure, GO Annotation, and Orthologs Detection of Candidate SiPOD and SiLAC Genes
3つのフィルターステップから得られた候補遺伝子は、MEME Suite v5.0.4を用いて、モチーフの最大数を20に設定し、保存されたモチーフについてスクリーニングされた。候補遺伝子の2Kbpプロモーター配列をPlantCAREデータベース(http:// bioinformatics.psb.ugent.be/webtools/plantcare/html/, accessed on 6 February 2022)に提出し、シス作用制御エレメントを検索した。さらに、InterProScan v5)を用いて、候補遺伝子に関連する分子機能を検索した。一方、オルソログ検索は SHOOT (https://www.shoot.bio/, 2022 年 2 月 6 日アクセス)を用い、植物データベースオプションを使用して行った。
2.7. Transcription Factor Enrichment Analysis
Plant Transcriptional Regulatory Map(PlantRegMap)プラットフォームを利用し、転写因子(TF)濃縮解析(http://plantregmap. gao-lab.org/tf_enrichment.php、2022年2月8日アクセス)を行い、ペルオキシダーゼおよびラッカーゼ遺伝子の制御に潜在的に関与する最も貢献度の高いTFファミリーを推定した。
2.8. Gene Expression Assays Using qRT-PCR
候補遺伝子の発現プロファイルは、LightCycler® 480IIリアルタイムPCR装置(Roche Diagnostics, Rotkreuz, Switzerland)でqRT-PCRを行うことで検証した。PCRの前に、プライマー3 blastオンラインツール(https://www.ncbi.nlm.nih.gov/tools/primer-blast/、2022年4月11日アクセス)を用いて5組のプライマー(表S2)を設計した。qRT-PCR実験はDossaら[74]に従って行った。各遺伝子について、合計 3 つの独立した複製を適用した。ゴマ アクチン遺伝子(NCBI 遺伝子 ID:LOC105159390)を陽性対照とした。2-∆∆CT 法を用いて標的遺伝子の相対発現を算出した。
3.Results and Discussion
3.1. Variability of Peroxidase and Laccase Genes in Sesame Pangenome and Phylogenetic Analyses
ゴマの汎ゲノム遺伝子セットから、Zongzhi13、Swetha、Mishuozima、Baizhima、Goenbaek、Yuzhi11ゲノム(それぞれはゴマの品種)において、それぞれ83、82、60、59、54、54のペルオキシダーゼ遺伝子がカウントされた(図2)。ゴマの種内レベルで観察されたペルオキシダーゼ数の変動性と同様に、高い種間変動性が観察され、Oryza sativa(イネ)、Zea mays(トウモロコシ)、Solanum tuberosum(ジャガイモ)、Betula pendula(シラカバ)、A. thaliana(シロイヌナズナ)、Vitis vinifera(ヨーロッパブドウ)でそれぞれ138、119、102、90、73、47のペルオキシダーゼ遺伝子がカウントされた。ほとんどの遺伝子クラスター(25)はすべての品種に共有されていたが、Swethaだけが種特異的な遺伝子クラスター(7)を示した。
平均44±7個のラッカーゼ遺伝子がゴマのパンゲノムから同定された。最も豊富なラッカーゼはSwetha (n = 56)で観察され、次いでZhongzhi13 (n = 48)、Goenbaek (n = 45)、Baizhima (n = 42)、Yuzhi11 (n = 40)、Mishuozhima (n = 35)であった。陸上植物の Prunus persica (n = 48) [82], Panicum virgatum (n = 49) [83], Solanum melongena (n = 42) [84] でも同様のラッカーゼの数が観察された。
オルソロジー解析の結果、核となるラッカーゼ遺伝子は20のクラスターに分類され、Swethaは6つの特定の遺伝子クラスターを保有していた。Yuzhi11とGoenbaekを除き、ペルオキシダーゼとラッカーゼ遺伝子は、ランドレース(MishuozimaとBaizhima)に比べ、近代品種(Zhongzhi13、Swetha)で世界的に豊富であった。実際、全ゲノムスケールで見ると、ランドレース(ミシュオジマとバイジマ)は環境適応をコードする特異的な遺伝子を示し、一方、近代品種は油に関連する機能的属性を持つ遺伝子を優先的に示した。興味深いことに、Swethaだけが特異的な遺伝子クラスターを示し、この品種にユニークなペルオキシダーゼとラッカーゼ遺伝子のレパートリーがあることが示唆された。しかし、Swethaの染色体スケールのゲノムはZhongzhi13 [86]の参照ゲノムに基づいて構築され、最初のコンティグレベルアセンブリーとしてショートリードアセンブリーを用いているため、この解釈には注意が必要である。
興味深いことに、Swethaだけが特異的な遺伝子クラスターを示し、この品種にユニークなペルオキシダーゼとラッカーゼ遺伝子のレパートリーがあることが示唆された。しかし、Swethaの染色体スケールのゲノムはZhongzhi13 の参照ゲノムに基づいて構築され、最初のコンティグレベルアセンブリーとしてショートリードアセンブリーを用いているため、この解釈には注意が必要である。
下流の解析には、参照ゲノムZhongzhi13のペルオキシダーゼおよびラッカーゼ遺伝子を用いた(表S3およびS4)。
同定された遺伝子を染色体上に配置した後(図3)、ゴマゲノム内のSiPODとSiLAC遺伝子の分布の進化的決定因子を評価した。その結果、同じ染色体上に隣接して存在するパラロガス遺伝子(タンデム重複遺伝子※3)と、互いに離れて存在し、しばしば異なる染色体上に位置する遺伝子(セグメント重複遺伝子※4)の2種類の遺伝子の関係が見いだされた(図S1およびS2)。SiPODでは、18組のパラロガス遺伝子がセグメント重複を起こし、1組がタンデム重複に由来することが明らかになった(図S1)。タンデム重複やセグメンテーション重複は、遺伝子ファミリーの拡大をもたらす進化の原動力と考えられている。タンデム重複やセグメンテーション重複によるペルオキシダーゼ遺伝子の重複は、ダイズ、キャッサバ、ニンジン、ジャガイモ、ワタ、スイカ、トウモロコシ、トマト、中国ナシなどの植物で広く報告されている。われわれの研究では、ペルオキシダーゼ遺伝子の拡大は主にセグメンテーション重複によってもたらされ、これはナシにおけるCaoらの所見と一致する。しかし、Betula pendulaやPopulus trichocarpaのような樹木では、タンデム重複がペルオキシダーゼ遺伝子拡大の主な要因であった。
同様に、合計20のSiLAC遺伝子はセグメント重複グループにのみ属していた(図S2)。対照的に、Solanum melongenaでは16個のラッカーゼ遺伝子がタンデム重複パターンでのみ検出された。Panicum virgatumでは、ラッカーゼ遺伝子のタンデム重複とセグメンテーション重複の両方が見つかった。
シンテニー解析※5の結果、31個(37%)のSiPOD遺伝子と26個(54%)のSiLAC遺伝子がA. thalinaのそれぞれの遺伝子セットとシンテニーを示し(図S3およびS4)、これらの種内で保存されていることが示唆された。
同定されたペルオキシダーゼ遺伝子とラッカーゼ遺伝子を分類するために、A. thaliana遺伝子を餌として系統樹を構築した。その結果、ペルオキシダーゼ遺伝子ファミリーは9グループ、ラッカーゼ遺伝子ファミリーは7グループであった(図4および図5)。樹形トポロジーは、ゴマ単独のペルオキシダーゼおよびラッカーゼ遺伝子の樹形と一致していた(図S5およびS6)。
同様に、合計20のSiLAC遺伝子はセグメント重複グループにのみ属していた(図S2)。対照的に、Solanum melongenaでは16個のラッカーゼ遺伝子がタンデム重複パターンでのみ検出された。Panicum virgatumでは、ラッカーゼ遺伝子のタンデム重複とセグメンテーション重複の両方が見つかった。
シンテニー解析の結果、31個(37%)のSiPOD遺伝子と26個(54%)のSiLAC遺伝子がA. thalinaのそれぞれの遺伝子セットとシンテニーを示し(図S3およびS4)、これらの種内で保存されていることが示唆された。
同定されたペルオキシダーゼ遺伝子とラッカーゼ遺伝子を分類するために、A. thaliana遺伝子を餌として系統樹を構築した。その結果、ペルオキシダーゼ遺伝子ファミリーは9グループ、ラッカーゼ遺伝子ファミリーは7グループであった(図4および図5)。樹形トポロジーは、ゴマ単独のペルオキシダーゼおよびラッカーゼ遺伝子の樹形と一致していた(図S5およびS6)。
※3
タンデム重複
→遺伝子やDNAの一部が重複して存在する状態を指します。具体的には、DNA配列の特定の領域が、同じ順序で連続して複製される現象を指します。これにより、元のDNA配列内で同じ遺伝情報が2回以上現れることになります。
※4
セグメント重複
→同じゲノム内で2回以上現れる現象を指します。これは、タンデム重複とは異なり、連続して重複するのではなく、特定のセグメントがゲノム内で離れた場所に複製されて存在することを意味します。セグメント重複はゲノム解析や遺伝的疾患の研究においても注意が必要です。重複領域が類似しているため、遺伝的な変異や疾患の原因を正確に特定することが難しくなる場合があります。したがって、セグメント重複を正確に解析することは、ゲノム研究や関連する分野において重要な課題の一つです。
※5
シンテニー解析
→シンテニー解析は、異なる種のゲノム間で遺伝子または他の機能的要素(たとえば、タンパク質コーディング領域など)の配置を比較し、研究するためのバイオインフォマティクスおよびゲノミクスの技術です。これには、関連する生物の間で保存された遺伝子の順序および遺伝子内容を特定し、分析することが含まれます。シンテニーは、異なるゲノムで遺伝子または遺伝子マーカーの相対的な位置を進化の過程で保存することを指します。
シンテニー解析の主要な側面には以下が含まれます:
遺伝子順序の保存:シンテニー解析は、あるゲノム内で隣接する遺伝子または遺伝子マーカーが他の種のゲノムでも同じ相対的な順序で見られるかどうかを判断しようとします。保存された遺伝子順序は、これらの遺伝子が機能的に関連しているか、共通の祖先から進化した可能性があることを示唆します。
進化に関する洞察:シンテニー解析は、種の進化の歴史と関係を理解するのに役立ちます。それは研究者に、ゲノムがどのように進化し、分岐したかを理解する手助けをします。
ゲノム注釈:シンテニー解析は、新しく配列解読されたゲノムの注釈を改善するのに役立ちます。保存された遺伝子順序を特定することで、研究者は既知の機能を持つ遺伝子との関連性に基づいて未知の遺伝子の機能を推測できます。
比較ゲノミクス:それは比較ゲノミクスで非常に有用で、異なるゲノム間の類似点と相違点を研究し、進化の過程で保存または変化した遺伝子または調節要素を特定することができます。
ゲノムの再配置:シンテニー解析はまた、ゲノムの再配置に関する情報も提供でき、これには遺伝子の重複、逆転、転座、削除などが含まれ、ゲノムの進化と適応を理解する上で重要です。
シンテニー解析は、進化生物学、ゲノミクス、および系統学などの分野で広く使用され、ゲノムの構造と進化に関する洞察を得たり、異なる種の遺伝的内容と組織に基づいて異なる種の関係を研究したりするためのツールとして利用されています。
有名な比較ツールにはCoGeやSyMapなどがある。
3.2.Expression Profiles of SiPOD and SiLAC Genes in Different Tissues and Candidate Genes Selection
潜在的な(+)-pinoresinol 合成酵素遺伝子を同定するために、多品種比較トランスクリプトームアプローチを利用した。ゴマ6品種(表S1)のRNA-Seqデータを、(i)種子での優先的発現、(ii)少なくとも種子発生の初期段階での発現、(ii)試験した全品種にわたる遺伝子の発現、の3つのフィルターステップに従って検査した。
ペルオキシダーゼ遺伝子(図6)については、8個のSiPOD(SiPOD41、SiPOD42、SiPOD47、SiPOD50、SiPOD52、SiPOD8、SiPOD63、SiPOD65)遺伝子のセットがZhongzhi13号の種子で優先的に発現した(図6A)
選択された遺伝子は、低含油量品種(LOS)と高含油量品種(HOS)の種子における発現を調べた(図6B)。その結果、SiPOD42、SiPOD52、SiPOD58、SiPOD63、SiPOD65、およびSiPOD50が特定された。SiPOD42は、LOSの2品種と比較して、10日目のHOSで最も発現していた。その発現は、HOSで優先的にすべての種子発生ステージで維持された。同様の観察はSiPOD52、SiPOD58、SiPOD50についても認められ、発芽後10日から20日まで発現が上昇し、その後発芽後25日から低下した。興味深いことに、SiPOD63とSiPOD65はすべての品種で初期(発芽後10日)に発現し、その後発現が低下した。
2回目のフィルタリングで得られた候補遺伝子は、種子で優先的に高発現するか、少なくとも種皮の色に関係なく種子発生の早い段階で発現するかについてスクリーニングされた(図6C)。こうして、SiPOD52、SiPOD63、SiPOD50、およびSiPOD65という遺伝子が候補として浮上した。SiPOD52とSiPOD63は、白色種子の初期(開花後5日と8日)に高い発現を示した。興味深いことに、SiPOD50は黒色種子で発芽5日後と8日後に高い発現が認められた。しかし、この遺伝子の発現は、種子の色に関係なく、すべての発生段階において非常に安定していた。
ラッカーゼ遺伝子については(図7)、SiLAC1、SiLAC12、SiLAC39が最初のフィルターラウンドでトップになった(図7A)。このうちSiLAC39は、低含油品種と高含油品種の両方で、開花後20日目に発現のピークを示した。同様に、SiLAC1の発現は、品種の種類に関係なく、開花後25日で高かった(図7B)。さらに、後の2つの遺伝子の発現は、黒色品種と白色品種で確認された(図7C)。興味深いことに、SiLAC1は黒色品種(中志33号)に比べ、白色品種(中志1号)では種子形成の初期段階(発芽後8日)で高い発現を示した。同様に、SiLAC39の発現は、白色種子品種(中志1号)において、発芽後11日目および17日目のいずれにおいても高い値を示した。
すべての候補遺伝子は、小野らによって記述され、図8に描かれているように、ゴマ汎ゲノムの中核遺伝子レパートリーに属し、またピノレジノール合成速度論に従うべきであるという原則に当てはまることは注目に値する。
簡単に説明すると,リグナン生合成の速度論から,リグナン生合成の上流段階(+(-)コニフェリルアルコールから+(-)ピノレシノール合成まで)で酸化酵素(ここではペルオキシダーゼと/またはラッカーゼの可能性)が発現することが示唆される。従って、ピノレシノール合成酵素は種子形成の早い段階で発現し、下流の生合成を可能にし、成熟期(〜開花後30日)に+(-)セサミン、+(-)セサモリン、+(-)セサミノールをもたらすと考えられる。したがって、Onoら[23]によってゴマ種子から抽出されたピノレシノール含量と転写産物データセット(図8)を組み合わせることによって、2つのペルオキシダーゼ(SiPOD52、SiPOD63)と2つのラッカーゼ(SiLAC1、SiLAC39)遺伝子を選択した。全体的に、4つの候補遺伝子のFPKM値は、開花後23日目(成熟期のおよそ1週間前)に減少していた(図8)。SiPOD50遺伝子は、種子のすべての発育段階において常に発現しており(図7C)、リグナン生合成の動態と一致しないため、除外した。そのため、下流のバイオインフォマティクス解析(シス作用エレメント、オルソログ同定)では、SiPOD50遺伝子を除外した。
3.3 Cis-Acting Elements, Related Transcription Factors, and Functional Attributes
候補遺伝子は類似した遺伝子構造を共有していたが(図9A-C)、シスエレメント解析(図9D)により、ホルモン応答、光応答、生物的ストレス応答、生理的発生など、幅広い多様な制御と機能特性が浮き彫りになった。このことは、SiPODとSiLAC遺伝子がゴマの広範な生物学的プロセスに関与している可能性を示唆している。
遺伝子制御における転写因子の重要な役割を知っている我々は、ペルオキシダーゼとラッカーゼの遺伝子制御に潜在的に関与する転写因子(TF)の候補を同定するために、SiPODとSiLACの全遺伝子を用いて転写因子指向の濃縮解析を行った。
TFファミリーは、v-myb avian myeloblastosis viral oncogene homolog (MYB), NAM (no apical meristem), ATAF1-2 (Arabidopsis thaliana activating factor), CUC2 (cup-shaped cotledon) (NAC), Basic leucine zipper (bZIP), Heat shock factors (HSF), Homeodomain-leucine zipper (HD-ZIP) などが予測された、 CUC2 (cup-shaped cotyledon) (NAC)、Basic leucine zipper (bZIP)、Heat shock factors (HSF)、Homeodomain-leucine zipper (HD-ZIP)、MIKC-type MADS-box (MIKC_MADS)が最も多かった。図9E,Fに描かれているように、MYBが最も優勢なTFであり、ペルオキシダーゼとラッカーゼの両方の発現において、MYBが調節的な役割を担っていると推定されることを示している。Shenらは、A. thalianaのトランスジェニック系統を用いて、スイートチェリー(Prunus avium cv. Hong Deng)のR2R3 MYBが、ペルオキシダーゼの活性化とアントシアニンの蓄積を通じて、塩ストレスを緩和し、抗菌抵抗性を提供できることを示した。さらに、A. thalianaのラッカーゼ(lac4またはlac17)とMYB63遺伝子の共発現は、A. thaliana変異株の矮化をレスキューすることが知られている。
SHOOTを用いた系統的アプローチにより、他の分類群における候補遺伝子のオルソログを調べたところ、Solanum lycopersicum、Arabidopsis thaliana、Brassica oleracea、Gossypium raimondii、Glycine max、Triticum aestivum、Oryza sativa、Zea maysなど、油糧作物および非油糧作物で相同配列が見つかった(表S5)。
GOアノテーションの結果、全てのペルオキシダーゼ候補遺伝子は、血液結合(GO:0020037)とペルオキシダーゼ活性(GO:0004601)を主な分子機能として、過酸化水素の異化過程(GO:0042744)に関与しているという仮説が支持された。ラッカーゼについては、SiLAC1とSiLAC39がリグニンの分解(GO:0046274)に関連し、銅イオン結合(GO:0005507)とオキシダーゼ活性(GO:0016491)が主要な分子機能である可能性がGOアノテーションで示された。GOアノテーションの結果から、SiPODとSiLACの両遺伝子は、(+)コニフェリルアルコールから(+)ピノレシノールへの変換に重要な要件である酸化的役割を持つと予測された。
RNA-seqデータの妥当性を評価するために、選択した遺伝子を用いてqRT-PCR実験を行った(図S7A)。相対発現の変化の傾向は、トランスクリプトームシーケンスデータの傾向と非常に一致していた(R2 = 0.8505)(図S7B);RNA-seqデータが信頼できることを示している。
実際、ペルオキシダーゼ遺伝子とラッカーゼ遺伝子は、コニフェリルアルコールとp-クマリルアルコールを酸化することができ、Zinnia elegansの細胞壁が木化する際に触媒として働くことが報告されている。従って、これらの遺伝子は、機能的検証のための貴重な候補であり、最終的には、バイオエンジニアリングによる製薬産業や食品産業への利用が期待される。ゴマは古典的な方法による遺伝子形質転換には難渋するため、毛状根法は、Ogasawaraらによって実証されたように、ゴマリグナンをin vitroで生産するための貴重な代替経路となるかもしれない。
4.Conclusions
ペルオキシダーゼ(83遺伝子)とラッカーゼ(48遺伝子)の候補遺伝子がゴマのゲノムから同定された。両遺伝子の遺伝子数は品種によってかなり異なっていた。トランスクリプトームデータの大規模なパネルと厳格なフィルタリングを利用して、4つの遺伝子(SiPOD52、SiPOD63、SiLAC1、SiLAC39)が(+)-ピノレシノール合成酵素をコードする候補として提案された。これらの遺伝子は様々な転写因子と相互作用することが予測され、多様な生理過程に関与していることが示唆された。本研究で得られた知見は、候補遺伝子の機能的研究、ひいてはリグナン合成に関するゴマの遺伝子改良への道を開くものである。