您好,欢迎光临武汉贝纳科技有限公司
027-62435310 | service@benagen.com | 中文 | English 咨询客服
您现在的位置:主页 > 市场与支持 > 文献解读 >

文献解读 | 园艺顶刊HR发表葡萄T2T参考基因组

葡萄是最重要的经济作物之一,黑比诺(Pinot Noir)是勃艮第的主要酿酒红葡萄品种,目前已被世界各地的葡萄酒产区广泛采用。

 

该研究使用PacBio HiFi测序技术为酿酒葡萄黑比诺(PN40024)组装了一个端粒到端粒(T2T)参考基因组(PN_T2T),与旧版本12X.v2相比在组装的完整性和准确性方面均有显著提升。PN_T2T共注释得到67%重复序列、19个着丝粒和36个端粒,为葡萄遗传学和育种提供了重要资源。

 

文章题目:The complete reference genome for grapevine (Vitis vinifera L.) genetics and breeding

发表期刊:Horticulture Research(IF=7.291)

发表时间:2023.04

 

 主要研究结果 

 

1、 端粒到端粒gap-free的参考基因组——PN_T2T

PN40024是一种高度纯合的黑比诺品种,使用PacBio平台测序,总共生成了21 Gb(~42×)HiFi数据。使用Hifiasm进行基因组组装,用已发表的葡萄基因组作为参考,用Mummer将38个contigs排列为19条染色体(图1),初步组装后只剩下一个gap。再用HiFi reads填补gap,最终生成了一个gap-free的PN_T2T基因组(494.87 Mb),比旧参考基因组12X.v2(426.18 Mb)长69 Mb。

 

表1 12X.v2和PN_T2T组装的基因组特征比较

图片

 

组装BUSCO评估为98.5%,旧参考基因组12X.v2中的所有9429个gaps都被PN_T2T基因组填补(图1A),12X.v2中的许多组装错误也得到了纠正,例如倒置和易位(图1A)。共注释了37534个基因和41064个转录本,重复序列比例为66.47%。

 

图片

图1葡萄的T2T gap-free参考基因组

 

2、 端粒和着丝粒

作者检查了每条染色体两端的150 kb序列,端粒重复单元的长度范围设置为5至12 bp。最后,检测到端粒重复单元(TTTAGGG/CCCTAAA),检测到PN_T2T基因组中含36个端粒,除了15号和17号染色体的短臂区域未检测到端粒重复序列(图1A,图2B)。其中,最长的端粒(31 kb)在8号染色体的短臂中,重复4479次,而最短的端粒(1260 bp)在7号染色体的长臂中,只有180次重复。

 

图片

图2 PN_T2T参考基因组中的重复序列注释

 

此外,为了检测着丝粒区域,该研究对30至500 bp的候选重复序列进行搜索,使用TRF在PN_T2T基因组中发现了470个不同的重复单位,其中107个bp重复是全基因组中最丰富的重复单元,约占基因组的3.95%,其次是321 bp(2.45%),214 bp(1.94%)和135 bp(1.05%)(图3A)。并且,214 bp和321 bp重复单元的序列分别由107 bp重复单元的两个和三个拷贝组成,TE分析也支持107bp重复区域的着丝粒特征(图2)。因此,作者用107bp重复序列鉴定着丝粒,并定位在所有19条染色体上(图1A,图2B)。

 

图片

图3 PN_T2T基因组中的着丝粒重复单元示意图

 

作者进一步筛选了高度连锁着丝粒区域中的所有基因。有意思的是,作者在着丝粒中鉴定到343个基因,其中包括179个具有Uniprot ID的基因。通过GO功能注释、富集分析,发现多个基因富集到与蛋白质结合、生长素转运蛋白、生殖发育、光形态发生等通路上(图4C)。

 

图片

图4 着丝粒中重复单元拷贝的特征和分布

 

3、 葡萄参考基因组中的基因簇

作者在葡萄参考基因组中总共鉴定到377个基因簇,这通常涉及局部重排,并且扩展到涉及数十到数百个基因的巨型碱基(图5)。在16号染色体(23-27 Mb)上,有599个基因富集的结构域(图5A)。在18号染色体(25~36 Mb)上,有1237个基因富集结构域(图5B)。其中,许多强富集的结构域是植物抗病基因(R基因)结构域的一部分。该研究分析了 41064 个 PN_T2T PCGs的结构域,并鉴定到3381个可能的R基因。这些R基因和基因簇为探索植物防御机制提供了重要线索。

 

图片

图5 已鉴定的基因簇示意图

 

4、 自交九代后的遗传杂合情况

该研究以PN_T2T为参考基因组,从NCBI下载了四个PN40024的重测序数据并进行分析。共检测到244215个SNP,其中208330个SNPs(85.3%)在所有四个样本中共享,而其他35886个SNP仅在1-3个样本中出现(图6A)。作者认为,前者可能是自交九代后PN40024的原始变异,而后者可能是在不同实验室和组织培养过程中产生的体细胞突变。

 

图片

图6 PN40024中杂合子区的特征分析

 

有趣的是,作者发现常见变异的hotspots在核心生物过程中富集,包括氧化还原过程和蛋白质磷酸化过程。2号染色体上的hotspots还富集在性别决定QTL区域(图6),这使性别决定基因的挖掘变得复杂,因为候选基因并没有出现在旧版本的参考基因组中。

 

 总结 

 

该研究使用PacBio HiFi测序技术,为酿酒葡萄黑比诺(PN40024)组装了一个端粒到端粒参考基因组(PN_T2T)。与旧版本参考基因组相比,PN_T2T在完整性和准确性方面均有显著提升,通过对基因簇、杂合区域等分析,发现其与香气和抗病性等复杂性状关联。总之,完整组装并注释的葡萄T2T参考基因组为葡萄遗传学和育种提供了重要资源。

 

参考文献:

Xiaoya Shi, et al. The complete reference genome for grapevine (Vitis vinifera L.) genetics and breeding, Horticulture Research, 2023.

 

 

 

 

Copyright © 2018 武汉贝纳科技有限公司 . All Rights Reserved. Designed by 鄂ICP备2021008976号-2技术支持:中网维优

友情链接

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10