您好,欢迎光临武汉贝纳科技服务有限公司
027-62435310 | service@benagen.com | 中文 | English 咨询客服
您现在的位置:主页 > 市场与支持 > 文献解读 >

文献解读|拟南芥首个完整着丝粒序列基因组Col-CEN

2021年11月12日,Science在线发表了题为“The genetic and epigenetic landscape of the Arabidopsis centromeres”的研究论文,该研究利用Nanopore超长测序技术结合高精度PacBio HiFi reads进行纠错,成功组装了首个拟南芥5条染色体着丝粒的全序列基因组Col-CEN,并揭示了着丝粒的遗传和表观遗传特征。

 

图片

 

文章标题:The genetic and epigenetic landscape of the Arabidopsis centromeres

 

发表期刊:Science

 

发表时间:2021.11.12

 

主要研究结果:

 

1.拟南芥着丝粒的完整组装

该研究测序获得73.6 Gb(~56×)ONT超长数据和14.6 Gb(~111.3×) PacBio HiFi测序数据,使用测得数据改进Col-0基因组(命名为Col-CEN v1.2),其中1、3和5号染色体完成了从端粒到端粒的组装,2号和4号染色体完成了除短臂45S rDNA簇和相邻端粒外的组装,5号染色体也存在一个gap(图1A-C)。

 

Col-CEN 组装与 TAIR10 高度一致,显示染色体臂内没有大的结构差异(图 1B)。对1号染色体进行FISH荧光标记,包括标记位于着丝粒附近的端粒重复簇(图1D)。

 

图片

图1 拟南芥着丝粒的完整组装

 

拟南芥着丝粒的特征是一个178 bp的卫星重复序列(CEN180),从头到尾排列并组织成更高阶的重复序列(图1D)。该研究使用人类T2T联盟的技术验证了着丝粒的结构和准确性,并观察到了跨着丝粒的长读长覆盖率。五个着丝粒在序列水平上相对不同,每个都表现出染色体特异性重复(图1E)。使用 Col-CEN 序列,设计了CEN180变体 FISH 探针来标记特定的着丝粒阵列(图1F),对染色体特异性卫星进行细胞遗传学验证。

 

2.拟南芥CEN180卫星重复分布和特征

该研究共鉴定了66,131个CEN180序列,每条染色体有11,848到15,613个拷贝(图2)。该研究使用CENH 3的ChIP-seq数据与Col-CEN组装进行比对,观察到CENH3的ChIP-seq的富集与CEN180变异距离之间存在负相关的关系(图2D,E),表明CENH3核小体结合的缺乏引发了卫星序列的趋异性。CENH3越集中的区域,CEN180重复度越高,并伴随着更高的CG DNA甲基化(图2D,E,G)。

 

图片

图2 拟南芥CEN180重复序列的分布和特征

 

3.ATHILA逆转录转座子对拟南芥着丝粒的插入

该研究在5号染色体着丝粒中,鉴定了大量的ATHILA逆转录转座子(图3A-C),通过CENH3 ChIP-seq数据,研究人员发现ATHILA的甲基化程度更高,如H3K9me2和CHG甲基化等,表明CEN180卫星序列和ATHILA反转座因子具有不同的表观遗传特征(图3E,F)。使用FISH对着丝粒进行细胞学验证,表明ATHILA的插入中断了拟南芥CEN180的遗传和表观遗传特征(图3H)。

 

图片

图3 ATHILA逆转录转座子对拟南芥着丝粒的插入

 

4.着丝粒内的标观遗传和减数分裂重组

    研究显示,着丝粒具有高的GC序列,伴有大量的CG、CGH和CHH甲基化,着丝粒发生交换的水平很低,但是交换在CG甲基化突变体met1-3中显著提高(图4),表明DNA甲基化可以影响减数分裂时着丝粒的重组交换。

 

图片

图4 着丝粒内的标观遗传和减数分裂重组

 

该研究分析了CEN180和ATHILA周围的染色质和转录情况,并将野生型与突变体met1-3进行比较,结合RNA-seq和siRNA-seq结果,显示ATHILA转录本在met1-3中表达增加,而在CEN180中则不同(图4D-E),进一步表明,CEN180重复序列与ATHILA元件的表观遗传调控不同。

 

总结:

该研究利用ONT超长测序,成功组装了拟南芥首个含着丝粒全序列的基因组Col-CEN,并分析了着丝粒的遗传和表观遗传特征;揭示了卫星序列的均质化和反转座因子共同驱动着丝粒进化的机制。

 

参考文献:

Naish M, et al. The genetic and epigenetic landscape of the Arabidopsis centromeres. Science. 2021.

 

贝纳基因某单子叶植物 ONT Ultra-long测序,不切胶、不富集片段,单张芯片reads N50大于100kb的数据量为22.6Gb,长度大于100kb的reads占总数据量31.5%。欢迎点击:贝纳基因ONT Ultra-long 新突破,助力构建超高质量基因组

 

Copyright © 2018 武汉贝纳科技服务有限公司 . All Rights Reserved. Designed by 鄂ICP备13016520号-1技术支持:中网维优