南湖新闻网讯(通讯员 丰胜求张毅鹏)皱皮木瓜(Chaenomeles speciosa),又名贴梗海棠,为蔷薇科木瓜海棠属落叶灌木。皱皮木瓜花朵艳红,贴生枝干之上,鲜艳夺目。陆游“千点猩红蜀海棠,谁怜雨里作啼妆”中所指便是贴梗海棠。除观赏价值外,皱皮木瓜还兼具食用价值与药用价值,其干果富含齐墩果酸和熊果酸,具有抗菌抗炎、抗病毒、抗氧化等作用。构建皱皮木瓜高质量基因组,解析皱皮木瓜药用成分生物合成途径,可为调控其重要药用成分的生物合成、提高药用木瓜品种提供新见解、新途径。
近日,我校药用植物学梅之南教授团队联合南京农业大学、中南民族大学、国药集团中联药业有限公司、武汉碳码生物科技有限公司以及北卡罗莱纳州立大学等单位科研人员在园艺一区(1/36)Horticulture Research上联合发表题为“A Telomere-to-telomere Reference Genome Provides Genetic Insight into the Pentacyclic Triterpenoid Biosynthesis in Chaenomeles speciosa”的研究论文。该研究通过HiFi和Hi-C测序,构建了首个皱皮木瓜T2T参考基因组,并结合比较基因组解析皱皮木瓜的三萜生物合成机制,为了解蔷薇科植物驯化和植物进化提供了宝贵的资源。
皱皮木瓜为二倍体植物,原产于中国,广泛栽培于世界各地。基于基因组survey,研究团队评估了皱皮木瓜基因组大小约为650.4 Mb。随后进行PacBio HiFi和Hi-C测序,利用Hifiasm组装出两套单体型,Hap1和Hap2。Hap1的基因组大小为592.84 Mb,包含230个contigs (N50为25.57 Mb),125个scaffold (N50为36.12 Mb),GC含量为37.41%。Hap2基因组大小为608.28 Mb,包含97个contigs (N50为29.34 Mb), 42个scaffold (N50为36.92 Mb), GC含量为37.25%。Hap1和Hap2,在基因组大小和基因数量方面具有相似性,同时具有良好的共线性。此外,两个单倍型基因组之间的单核苷酸多态性(SNP)、插入-缺失(InDels)和结构变异(SV)存在明显差异,为了解皱皮木瓜遗传多样性提供了大量信息来源。基于Hap1和Hap2,研究团队组装了T2T水平的皱皮木瓜基因组。其基因组全长650.4Mb,contig N50为35.5Mb。其中,632.3 Mb被锚定在17条染色体上,有12条染色体仅有1条contig组成,在11条染色体两端鉴定到端粒,17条染色体上均鉴定到着丝粒。BUSCO评估结果、LAI评分、二三代数据比对结果均证实了组装基因组良好的完整性和准确性。
图1 皱皮木瓜的基因组调查与组装
研究团队使用从头注释和同源注释的方法来鉴定重复序列,49.5%的皱皮木瓜基因组序列被预测为重复序列,约312.9 Mb。序列分析表明,重复序列主要由TE组成。其中,LTR最为丰富,占整个基因组的36.3%,包括Gypsy元件(22.7%)、Copia元件(7.3%)和其它序列。
基于从头注释、同源注释和转录组注释,共在皱皮木瓜中基因组中预测到45515个高置信度的蛋白编码基因,其中93%的基因都能得到功能注释。共鉴定到685个tRNA、4205个rRNA、274个snRNA和739个snoRNA。
表1 皱皮木瓜基因组组装数据统计
研究团队选择11个物种与皱皮木瓜进行比较基因组学分析。基因家族聚类分析表明11个物种中普遍存在6958个基因家族,皱皮木瓜存在5658个特有基因家族。GO富集分析表明这些特有基因主要参与辅因子代谢、辅酶代谢和蛋氨酸代谢过程。KEGG富集分析表明,物种特有基因主要参与碳代谢、丙酮酸代谢、半乳糖代谢和萜类物质生物合成。系统进化发育分析表明,皱皮木瓜和苹果、杜梨、西洋梨被聚类在一起,它们可能由同一祖先进化而来。皱皮木瓜和苹果的分化时间约为10.0个百万年前,苹果族与桃亚属的祖先在约10.92个百万年前分化,蔷薇科物种在约98.81个百万年前分化。基因家族收缩扩张分析表明,皱皮木瓜有320个基因家族发生扩张,与苹果扩张基因家族数量相似;有158个基因家族发生收缩,约为苹果收缩基因家族的50%。皱皮木瓜收缩的基因家族主要富集于脂质转运、信号转导过程等,扩张的基因家族与单萜类、二苯乙烯庚烷类、姜辣素、亚油酸、类黄酮、倍半萜类和三萜类的生物合成有关。
六种蔷薇科物种的系统发育分析表明,西洋梨、苹果、皱皮木瓜同属一个分支,约46个百万年前从同一祖先分化而来。这三个物种共同经历了一次四倍化事件,导致它们的染色体数量加倍,达到16条。WGD分析显示,Ks分布在0.2~0.3处出现了显著峰值,这一事件可能与西洋梨、苹果、皱皮木瓜中近期发生的四倍化事件有关。
图2 皱皮木瓜基因组同源聚类和系统发育分析
图3 皱皮木瓜的WGD特征、共线性和染色体进化
齐墩果酸和熊果酸是羟基五环三萜烯酸,《中国药典》中以齐墩果酸和熊果酸含量作为木瓜中药材质量控制的重要指标。植物五环三萜类化合物主要由甲羟戊酸途径和戊糖磷酸途径合成。本研究将皱皮木瓜与其它七个物种中涉及甲羟戊酸途径的四个基因家族进行比较,发现皱皮木瓜基因组中存在11个β-香树素合酶基因,其中10个基因分布在9号染色体上的两个基因簇中。基因簇1的长度从12,157,281 bp到12,428,418 bp,包含8个β-香树素合酶基因,9个其它基因和64个LTR反转录转座子。基因簇2的长度从31,206,028 bp到31,327,645 bp,包括2个β-香树素合酶基因,5个其它基因和29个LTR反转录转座子。
基因家族的鉴定进一步揭示了2个角鲨烯合酶的成员、12个角鲨烯2,3-氧化环化酶的成员、11个β-香树素合酶的成员和9个β-香树脂醇28-单加氧酶的成员。与其它蔷薇科物种相比,角鲨烯合酶、β -amyrin合酶和β-香树脂醇28-单加氧酶基因家族在皱皮木瓜基因组中显著扩张,这可能是该物种具有高含量的齐墩果酸和熊果酸的原因。
图4 皱皮木瓜中齐墩果酸、熊果酸的生物合成途径和β-香树素合酶基因簇
本研究通过HiFi和Hi-C测序构建了首个木瓜属植物皱皮木瓜的T2T基因组,通过比较基因组分析确定了皱皮木瓜扩张和收缩的基因家族与植物代谢或生物过程的关联,鉴定了与齐墩果酸和熊果酸生物合成途径相关的基因家族,为了解植物五环三萜类物质的生物合成提供了宝贵的资源,为了解蔷薇科植物驯化提供了新的见解。
我校贺少方和张毅鹏、国药集团中联药业有限公司翁端阳为论文共同第一作者,植物科学技术学院舒少华副教授、王学奎副教授和南京农业大学虞夏清副教授为共同通讯作者。该研究得到了湖北省产业链关键项目(2021ACA004和2022AC003-01-003)的资助。
【英文摘要】
Chaenomeles speciosa(2n = 34), a medicinal and edible plant in the Rosaceae,is commonly used in traditional Chinese medicine. To date, the lack of genomicsequence and genetic studies has impeded efforts to improve its medicinalvalue. Herein, we report the use of an integrative approach involving PacBioHiFi (third-generation) sequencing and Hi-C scaffolding to assemble ahigh-quality telomere-to-telomere genome ofC. speciosa.Thegenome comprised 650.4 Mb with a contig N50 of 35.5 Mb. Of these, 632.3 Mb wereanchored to 17 pseudo-chromosomes, in which 12, 4, and 1 pseudo-chromosomeswere represented by a single contig, two contigs, and four contigs,respectively. Eleven pseudo-chromosomes had telomere repeats at both ends, andfour had telomere repeats at a single end. Repetitive sequences accounted for49.5% of the genome, while a total of 45,515 protein-coding genes have beenannotated. The genome size ofC. speciosawasrelatively similar to that ofMalus domestica.Expanded or contracted gene families were identified and investigated for theirassociation with different plant metabolisms or biological processes. Inparticular, functional annotation characterized gene families that wereassociated with the biosynthetic pathway of oleanolic and ursolic acids, twoabundant pentacyclic triterpenoids in the fruits ofC. speciosa. Taken together, this telomere-to-telomereand chromosome-level genome ofC. speciosanotonly provides a valuable resource to enhance understanding of the biosynthesisof medicinal compounds in tissues, but also promotes understanding of theevolution of the Rosaceae.
论文链接:https://doi.org/10.1093/hr/uhad183
审核人 王学奎 舒少华