开年两篇项目文章| T2T基因组和多组学助力三萜皂苷生物合成研究
英文标题:Telomere-to-telomere gap-free genome assembly provides genetic insight into the triterpenoid saponins biosynthesis in Platycodon grandiflorus
发表时间:2025.02.01
发表期刊:Horticulture Research
影响因子:8.1
2025年2月,安徽中医药大学查良平副研究员、桂双英教授级中国中医科学院中药资源中心苏平副研究员等在《Horticulture Research》杂志在线发表了题为Telomere-to-telomere gap-free genome assembly provides genetic insight into the triterpenoid saponins biosynthesis in Platycodon grandiflorus1的研究成果。本研究组装了T2T级别的高质量桔梗基因组图谱,解析了桔梗三萜皂苷的生物合成途径,为相关基因的发现和功能解析奠定了基础,对桔梗三萜皂苷生物合成提供新的见解。贝纳基因参与该项目ONT超长、HiFi和HiC测序工作,以及T2T基因组组装和分析工作。
桔梗(Platycodon grandiflorus)是亚洲地区广泛使用的传统药用植物,以其抗炎和保肝特性而闻名。桔梗根中含有活性成分——三萜皂苷,这些成分不仅具有显著的药理作用,也是桔梗在临床应用中的重要价值所在。然而,尽管桔梗的药用价值被广泛认可,但其根部三萜皂苷的生物合成途径尚未被完全揭示,相关的基因也一直没有明确。
1. 桔梗T2T基因组组装、注释和进化分析
本研究结合ONT Ultra-long、HiFi和HiC测序技术,组装了桔梗高质量的端粒到端粒(T2T)基因组图谱,最终组装的基因组大小为593.56 Mb,N50为65 Mb,9条染色体0 gap无缝连接,且9个着丝粒和18个端粒区域全部得到确认(图1)。基因组组装的完整性和一致性较好,BUSCO比对率为98.4%,二代和三代数据的回比率几乎为100%。通过对桔梗基因组的结构注释,发现转座子区域占了桔梗基因组的66.5%,屏蔽重复序列后预测得到27808个蛋白编码基因。通过比较基因组分析,证实桔梗经历了核心双子叶植物的γ-WGT事件。研究团队对桔梗扩张的基因家族进行KEGG富集分析,并将倍半萜类和三萜类生物合成途径中注释的5个扩张基因命名为SQE1至SQE5。
图 1 桔梗T2T基因组组装和端粒着丝粒区域预测
2. 挖掘三萜皂苷生物合成关键基因
根据组装的桔梗基因组,研究团队通过KEGG注释和同源蛋白搜索来识别参与三萜类化合物生物合成的催化酶基因,其中在MVA途径中发现由全基因组复制事件产生的两个PgAACTs和三个PgHMGRs基因 ,在MEP途径中发现由串联重复产生的三个PgHMGRs 基因(图2)。同时,研究团队发现桔梗的环氧化酶基因(CYPs)普遍受基因复制事件影响,鉴定的177个CYPs中有63个串联重复基因,说明串联复制是推动桔梗CYP基因家族扩张的主要驱动力。
通过基因组、转录组和代谢组的整合分析,研究人员发现在桔梗的三萜皂苷合成中,CYP716A、CYP72A和CYP749A家族的基因在三萜皂苷的合成过程中起到了关键作用。CYP72A家族酶催化齐墩果酸(oleanolic acid)C2和C23位点的羟化,CYP716A 家族催化C-16的羟化反应产生远志酸(polygalacic acid),然后在CYP749A的C-24羟化和氧化活性下转化为桔梗皂甙元(platycodigenin)和桔梗酸A(platycogenic acid A)。桔梗三萜皂苷合成相关的PgCYP716A、PgCYP72A和PgCYP749A基因与桔梗皂苷的合成存在正相关关系。
图 2 桔梗基因组中的基因复制和三萜化合物生物合成
本研究组装了桔梗的第一个T2T基因组图谱,阐明了桔梗的进化过程,并基于T2T基因组探究了桔梗皂苷的生物合成途径,对CYP450基因家族进行了分析。通过转录组和代谢组筛挖掘了桔梗三萜皂苷生物合成的候选CYPs,并对桔梗皂苷前体羟基化提供了新的见解,为理解CYP450基因家族的功能奠定了基础。
英文标题:Deciphering the biosynthetic pathway of triterpene saponinsin Prunella vulgaris
发表时间:2025.01.27
发表期刊:The Plant Journal
影响因子:6.2
近日,南京农业大学园艺学院/前沿交叉研究院薛佳宇/Yves Van de Peer课题组与合作者在《The Plant Journal》杂志在线发表了题为Deciphering the biosynthetic pathway of triterpene saponinsin Prunella vulgaris 2的研究成果, 开发了一套整合多层次筛选基因的流程,能利用多组学数据进行高效筛选、快速获得目标基因,从而解析完整的生物合成途径。贝纳基因参与该项目ONT、二代和HiC测序工作,以及基因组组装工作。
夏枯草(Prunella vulgaris)是唇形科的多年生草本植物,广泛分布于中国秦岭以南及其他温带和亚热带地区,其干燥果穗在初夏采收后常用于传统中药。中医经典著作《本草纲目》记载其具有“清肝明目,散结解毒”的功效。现代研究表明,其主要活性成分为熊果酸和齐墩果酸型三萜皂苷,具备抗炎、降血压、改善血液循环等药理作用,使夏枯草成为潜在的抗肿瘤药物。植物的三萜类化合物的生物合成途径始于甲羟基戊二酸(MVA)途径,并在一定程度上由2-甲基-D-赤霉醇-4-磷酸(MEP)途径贡献,最后几步需要氧化酶和糖基转移酶的参与,目前夏枯草中尚未明确负责最后几步合成这些三萜皂苷的基因。
1.夏枯草基因组和代谢组研究
结合ONT、HiC和二代测序技术,研究团队组装了高质量染色体级别的夏枯草参考基因组(图1),基因组由14条染色体组成,大小为683.87 Mb,预测了45001个蛋白质编码基因,注释后BUSCO比对率为98.1%。研究团队通过靶向代谢组分析,从夏枯草的所有组织中鉴定出了63种萜类化合物,包括11种二萜类、5种倍半萜类、42种三萜类和5种三萜皂苷类。除了花序外,所有组织均富含熊果酸和齐墩果酸型三萜皂苷,而花序则含有几乎所有的三萜类化合物。
图 1 夏枯草基因组圈图
2. 夏枯草三萜皂苷生物合成关键基因鉴定和验证
为了确定夏枯草三萜皂苷合成最后三个步骤的酶编码基因,研究团队根据组装的夏枯草基因组,首先通过同源比对、HMM模型搜索以及Pfam域识别验证的方式,进行了三个基因家族(OSC、CYP450和UGT)的全基因组鉴定。以先前研究总结的最后三步酶编码基因作为参考,选定18个植物基因组中的OSC、CYP450和UGT基因家族相关的基因构建系统发育树,结合基因表达量评估、转录组-代谢组关联以及WGCNA的多层次筛选方法,确定了3个OSC、5个CYP716和4个UGT73基因为候选基因。随后研究人员从夏枯草中克隆了候选基因,并导入烟草叶中进行瞬时表达来研究OSC/CYP716的功能,结合气相色谱-质谱(GC-MS)确定和表征了三萜皂苷生物合成中最后三个步骤的所有酶,成功揭示了夏枯草三萜皂苷的完整生物合成途径。
图 2夏枯草三萜皂苷生物合成候选基因功能验证
本研究组装了夏枯草高质量的染色体级基因组图谱,研究团队以多组学数据为基础,整合系统发育分析、基因表达评估、代谢组-转录组关联分析和加权基因共表达网络分析,提出一套高效筛选未知酶编码基因的方法论,对于植物代谢通路未知基因筛选有着广泛的应用潜力。
参考文献:
1 Yu, Hanwen, et al. "Telomere-to-telomere gap-free genome assembly provides genetic insight into the triterpenoid saponins biosynthesis in Platycodon grandiflorus." Horticulture Research (2025): uhaf030.
2 Liu, Si‐Jie, et al. "Deciphering the biosynthetic pathway of triterpene saponins in Prunella vulgaris." The Plant Journal 121.2 (2025): e17220.