您好,欢迎光临武汉贝纳科技有限公司
027-62435310 | service@benagen.com | 中文 | English 咨询客服
您现在的位置:主页 > 市场与支持 > 文献解读 >

文献分享 | Nature Plants发表燕麦大型基因组近完成图

image.png

英文标题:The near-complete genome assembly of hexaploid wild oat reveals its genome evolution and divergence with cultivated oats 

发表时间:2024.12.3

发表期刊:Nature Plants

影响因子:15.8


2024年12月3号河北大学生命科学学院杜会龙团队在《Nature Plants》杂志在线发表了题为The near-complete genome assembly of hexaploid wild oat reveals its genome evolution and divergence with cultivated oats的研究成果。本研究构建了不实野燕麦和栽培皮燕麦两个大型基因组近完成图,不实野燕麦基因组大小为10.99 Gb,栽培皮燕麦基因组大小为10.89 Gb,是国际上动植物领域首次报道的超过10 Gb的近乎完整的基因组图谱。该研究系统地揭示了野生和栽培燕麦的着丝粒序列结构全貌及动态演化历程,鉴定出许多与燕麦驯化相关的重要基因组进化事件和关键基因。本研究在染色体4A和4D之间发现了一个约28 Mb的大片段复制,该片段携带多个与重要农艺性状相关的基因,并通过对全球117份野生和栽培燕麦材料的研究验证了这些基因在燕麦早期驯化中的重要作用。此外,通过群体遗传学分析进一步揭示了许多与驯化相关的重要候选基因,为燕麦的功能基因组学研究和遗传改良奠定了重要基础。



研究背景

栽培种燕麦(Avena sativa L.,2n = 6x = 42,AACCDD)作为第七大谷类作物,是世界上最重要的谷物作物之一。燕麦包括二倍体、四倍体和六倍体种,这些种是通过杂交和多倍化演化而来,并且伴随着频繁的基因组间易位。栽培种燕麦被认为是从六倍体野生祖先种不实野燕麦(Avena sterilis L.)驯化而来,该野生种具有极强地环境适应能力,蕴藏着大量可用于栽培种作物改良的珍贵遗传资源。然而,目前可获取的野生六倍体燕麦物种的基因组和遗传资源相对有限,这严重制约了对栽培燕麦的演化和驯化历史的认知,并影响了对燕麦重要农艺性状有益等位基因的探索。



主要研究结果

1. 不实野燕麦和栽培皮燕麦基因组组装和注释

研究团队结合多种测序技术对不实野燕麦进行基因组测序,组装基因组的数据包括320 Gb HiFi测序数据、181.28 Gb ONT超长测序数据(N50>100 kb)、96.83 Gb Illumina二代测序数据和165.82 Gb Hi-C测序数据。最终组装的基因组大小为10.99 Gb,N50为473.40 Mb,成功鉴定了21条染色体的42个端粒,并完成了A/C/D亚基因组分型,基因组gap数量仅为14个。不实野燕麦基因组的BUSCO评估率为99.5%,组装的LAI指数为18.24。此外,研究团队对栽培皮燕麦“Marvellous”进行了高质量的染色体级基因组组装,其基因组大小为10.89 Gb,N50为108.51 Mb。研究团队还对不实野燕麦、栽培皮燕麦和栽培裸燕麦进行了基因组结构和重复序列注释,为深入理解燕麦基因组特征及进化历程提供了坚实的数据基础和依据。

image.png


图 1不实野燕麦基因组近完成图构建


2. 野生和栽培燕麦的着丝粒多样性与演化

研究团队利用燕麦着丝粒特异性抗体(anti-CENH3)进行了ChIP-seq实验,确定了野生燕麦和栽培燕麦的着丝粒区域和边界,并发现野生燕麦的着丝粒区域的大小(5.6 Mb-10.1 Mb)大于栽培燕麦,并且A亚基因组的着丝粒大小大于其他亚基因组。燕麦着丝粒区域中富集了禾本科中保守的着丝粒特异性逆转录转座子CRM,并且着丝粒中的LTR-RT插入时间相比其他染色体区域更为近代。在C亚基因组中,CRM的比例最低,可能是塑造着丝粒多样性的重要推动因素。此外,在野生燕麦的C亚基因组着丝粒中,研究团队发现了独特的Cen46和Cen55着丝粒卫星重复单元,这些重复单元也存在于二倍体和四倍体的祖先种的C亚基因组中。总体而言,新近扩增的逆转录转座子和卫星重复单元数量的变异导致了六倍体燕麦C和A/D亚基因组之间着丝粒区域的分化,为燕麦的着丝粒进化机制提供了重要线索。


image.png


图 2 不同燕麦的着丝粒区域特征


3. 野生和栽培燕麦的结构变异

以不实野燕麦作为参考基因组,研究团队在不同的栽培种燕麦中鉴定了112,603-204,665个长度大于50 bp的结构变异,其中包括56,544-141,745个插入、55,354-62,891个缺失、57-312个易位以及576-1,265个倒位。与六倍体野生燕麦以及祖先二倍体/四倍体物种相比,在栽培燕麦的D亚基因组中检测到了许多特定的倒位。存在/缺失变异(PAVs)是野生和栽培燕麦之间最常见的结构变异,基因和基因调控区域的PAV数量在C亚基因组中低于A和D亚基因组。87.43%的PAV与转座元件重叠,主要由LTR-RTs贡献,表明燕麦基因组中转座子的快速扩增是结构变异产生的驱动因素。总体而言,研究团队为野生和栽培燕麦之间结构变异的研究提供了全面见解,揭示结构变异可能推动了野生和栽培燕麦为适应环境而进行的基因组演化过程。


image.png


图 3 野生和栽培燕麦的结构变异


4. 燕麦群体结构分析和鉴定驯化改良相关的基因

为了调查燕麦的遗传多样性,研究团队对全球117个品种的燕麦进行了全基因组重测序,并鉴定了276,933个非同义突变的SNPs。通过SNPs进行系统发育和主成分分析,野生燕麦被聚类为一组,而栽培燕麦则被聚类为两组。另外,研究发现野生燕麦的连锁不平衡衰减速度较快,表明经过驯化和改良后,栽培燕麦的遗传多样性明显减少。通过选择消除分析,研究团队鉴定了与驯化和改良相关的受选择区域,其中1,267个基因与燕麦驯化相关,1,817个基因与燕麦改良相关。这些基因的同源基因在水稻和小麦驯化和改良中与农艺特征相关联,如产量、品质、不育性、抽穗期、生物抗性、逆境耐受性和养分利用效率等。该研究成果为燕麦驯化和改良相关的基因挖掘提供了宝贵的资源,有助于推动燕麦育种研究的发展。


image.png


图 4 野生和栽培燕麦的群体结构分析和选择消除分析


5. 栽培燕麦4A和4D染色体间的大片段重复

研究团队利用Hi-C、荧光原位杂交、基因组共线性图以及reads覆盖度等信息和实验,验证了在栽培种燕麦染色体4A的末端发生了一个28 Mb的大片段复制,并代替了染色体4D的末端端粒(Dup4A:1-28Mb)。这个复制事件在二倍体、四倍体和野生六倍体燕麦中均未见。研究团队利用重测序数据,验证了几乎所有栽培种都携带两个高度相似的来自4A的拷贝,而所有野生燕麦都不包含此重复,表明这个重复事件发生在燕麦驯化的早期阶段。 此外,研究团队在不实野燕麦的染色体4A和4D大片段复制区域鉴定了529个基因,其中121个基因与已报道的与农艺重要性状相关的基因同源,包括产量、粒重、抽穗期、生物抗性、逆境耐受性等方面。值得注意的是,4A区域中的基因比4D区域的同源基因表现出更高的转录丰度,且具有更低的甲基化水平,这表明在驯化过程中,重复区域的有益等位基因受到了较强的选择作用。


image.png


图 5 染色体4A到染色体4D之间的大片段重复



总  结

总的来说,本研究近乎完整的T2T野生燕麦和高质量的栽培燕麦基因组,以及对全球117个燕麦品种进行的全基因组重测序,为我们提供了全新的见解,揭示了栽培燕麦和野生燕麦之间的演化历史,以及基因组的演化和分化过程。这些高质量基因组数据以及燕麦品种之间的遗传变异为燕麦的演化、功能基因组学以及遗传改良研究提供了坚实的研究基础。


参考文献:

He, Q., Li, W., Miao, Y. et al. The near-complete genome assembly of hexaploid wild oat reveals its genome evolution and divergence with cultivated oats. Nat. Plants (2024). https://doi.org/10.1038/s41477-024-01866-x

Copyright © 2018 武汉贝纳科技有限公司 . All Rights Reserved. 鄂ICP备2021008976号-2