您好,欢迎光临武汉贝纳科技有限公司
027-62435310 | service@benagen.com | 中文 | English 咨询客服
您现在的位置:主页 > 市场与支持 > 文献解读 >

MP项目文章|两个重要苜蓿材料的T2T基因组揭示着丝粒演化机制

image

英文标题:Two complete telomere-to-telomere Medicago genomes reveal the landscape and evolution of centromeres

发表时间:2025.07.25

发表期刊:Molecular Plant

影响因子:24.1


2025年7月,中国科学院遗传与发育生物学研究所冯健研究团队与韩方普研究团队合作,在国际植物学权威期刊Molecular Plant在线发表了题为“Two complete telomere-to-telomere Medicago genomes reveal the landscape and evolution of centromeres”的研究成果。本研究基于长读长测序技术,成功构建了2个重要苜蓿材料A17(Medicago truncatula)和R108(Medicago littoralis)的T2T基因组。结果揭示了两者在着丝粒区域的显著差异,反映出谱系特异性的卫星重复序列演化模式,为豆科植物功能基因组学与着丝粒生物学研究提供了重要的参考资源。


贝纳基因参与该研究T2T基因组的测序工作。



研究背景

豆科植物(如:大豆、苜蓿)是全球重要的农业作物,不仅为人类和动物提供优质的蛋白质与油脂来源,还通过与固氮菌的共生关系,也为土壤改良提供氮素支持。紫花苜蓿A17(Medicago truncatula)作为研究豆科遗传与生物学的经典模式植物,广泛应用于根瘤共生、基因调控等研究中。另一常用材料R108(Medicago littoralis)具有更强的组织再生能力和更高的遗传转化效率,适用于突变体构件与功能基因筛选。目前,A17和R108两个重要材料的参考基因组虽已发布,但仍存在多个组装缺口,尤其是着丝粒等复杂结构区域尚未被完整解析,限制了对豆科染色体结构与功能演化的深入理解。



研究亮点

1、2个重要苜蓿材料T2T基因组组装与注释

本研究针对A17和R108两个关键苜蓿材料,结合PacBio HiFi、ONT 超长和 Hi-C 数据,系统开展端粒到端粒(T2T)基因组的de novo组装。采用hifiasm软件,分别尝试了五种不同的组装策略(HiFi-only,HiFi+Hi-C,HiFi+ONT,HiFi+ONT+Hi-C,ONT-only)。根据初步组装的连续性与完整性评估结果,A17最终采用HiFi+ONT策略,R108则选用HiFi+ONT+Hi-C策略作为组装骨架,并通过Hi-C辅助将组装结果挂载到8条染色体,与细胞学核型结果一致(图1A-B)。


初始组装中,A17存在3个gap,R108存在1个gap,后续通过gap填补,最终获得无gap、完整的A17 v6.0和R108 v3.0基因组(图1C)。

image

图1 两个苜蓿T2T基因组


对基因组进行进一步评估,A17 v6.0大小为494.47Mb,contig N50为63.90Mb,BUSCO完整度为99.19%;R108 v3.0 大小为415.27 Mb,contig N50为54.40 Mb,BUSCO为99.32%。两者均成功鉴定出16个端粒,均已达到T2T基因组水平。


在基因注释方面,基于增强的BRAKER3流程并结合GSAMan手动校审,对A17和R108分别预测出50,237和48,451个高可信基因模型。通过与A17 v5.0和R108 v2.1的基因模型一对一对比,分别获得了75.08%和86.06%的基因模型匹配度,此外,新预测基因也在公共转录组数据中获得表达支持。


2、着丝粒研究亮点

着丝粒是染色体在细胞分裂过程中关键的锚定区域,通常由CENH3组蛋白标记。该研究基于针对苜蓿CENH3 N端的抗体,在A17和R108中全面识别了所有功能性着丝粒,并通过ChIP-seq界定各染色体的核心着丝粒边界。结果显示,尽管R108的基因组更小,其R着丝粒范围(1.1–1.4 Mb)普遍大于A17(0.9–1.3 Mb),且两者在序列组成上存在差异显著(图2D)。


TRASH注释显示,A17的着丝粒主要由CentM168(168 bp)和CentM183两种卫星重复构成,而R108则几乎完全由CentM168组成(图2E)。此外,A17中存在CentM51(Chr8)等特有重复,而R108则含有如CentM515(Chr2)、CentM59(Chr3)和 CentM287(Chr3和6)等特异重复。揭示出苜蓿着丝粒正经历快速且支系特异的重复演化。FISH验证结果进一步确认了上述卫星序列的染色体定位(图2F)。值得注意的是,A17中CentM168富集于CENH3结合的核心区,CentM183分布于外围,二者形成功能和结构上的分化(图2E)。这种新颖的结构可能有助于维持核心着丝粒稳定,避免染色体重排或断裂。

image

图2 两个苜蓿着丝粒结构深入探究


3、转座子参与着丝粒结构的构建

LTR-RTs是植物着丝粒的重要组成部分。在本研究中,研究者分别在A17与R108基因组中鉴定到1169与878个完整LTR-RT元件,其中定位于着丝粒区域的数量分别为26个和50个。值得注意的是,着丝粒中富集了大量破碎或嵌套的LTR插入,表明这些区域经历了活跃的转座事件(图2H-I)。进一步分析显示,A17着丝粒中的LTR元件相比非着丝粒区更为年轻,且具有更高的序列一致性(图3J-L),提示其可能在着丝粒近期构建与功能维持中发挥了重要作用。

image

图3 转座子参与着丝粒构建



总结

该研究构建关键苜蓿材料A17与R108的T2T级别参考基因组,极大地推动了豆科基因组学研究。通过CENH3 ChIP-seq绘图与重复序列注释,首次清晰描绘了两种类型的着丝粒,为理解着丝粒的起源与演化提供了全新视角。




参考文献:

Shen L, et al. Two complete telomere-to-telomere Medicago genomes reveal the landscape and evolution of centromeres. Mol Plant. 2025.

Copyright © 2018 武汉贝纳科技有限公司 . All Rights Reserved. 鄂ICP备2021008976号-2