项目文章 | Hortic Res发表首个牛油果T2T级别参考基因组
英文标题:A telomere-to-telomere gap-free reference genome assembly of avocado provides useful resources for identifying genes related to fatty acid biosynthesis and disease resistance
发表时间:2024.04.22
发表期刊:Horticulture Research
影响因子:7.6
2024年4月《Horticulture Research》杂志在线发表了题为A telomere-to-telomere gap-free reference genome assembly of avocado provides useful resources for identifying genes related to fatty acid biosynthesis and disease resistance1的研究成果,中国科学院西双版纳热带植物园为第一单位,杨天宇博士和蔡一帆博士后为共同第一作者,杨云强副研究员和杨永平研究员为共同通讯作者。本研究组装了T2T级别的高质量西印度品种牛油果基因组图谱,鉴定了与疾病抗性相关基因以及脂肪酸合成相关基因,对牛油果的疾病免疫机制和脂肪酸生物合成提供新的见解。贝纳基因参与该项目Pacbio HiFi、ONT Ultra-long和Pore-C测序工作。
研究背景
鳄梨(Persea americana Mill.)也称为牛油果,起源于中美洲,是一种热带常绿木本植物。牛油果果实富含不饱和脂肪酸,口感如奶油般,具备独特香气。先前的研究已对牛油果组装了染色体级别的基因组图谱,而T2T级别的无间隙基因组组装图谱尚未见报道,疾病抗性相关的NLR基因和脂肪酸生物合成相关基因的研究相对较少。
主要研究结果
1. 牛油果T2T基因组组装、注释和评估
本研究利用NGS测序对牛油果基因组进行初步调查,基因组大小约为864 Mb,杂合率为0.637%。根据调查结果,结合Pacbio HiFi、ONT Ultra-long和Pore-C测序技术,对基因组进行组装和间隙填补,最终组装的基因组大小为841.6 Mb,N50为78.8 Mb,由12条染色体组成(图1 A),端粒数量为24个。
通过对牛油果基因组的结构注释,发现重复序列占了牛油果的基因组的57.9%,对其进行软屏蔽后,共预测得到40629个蛋白编码基因。第12条染色体包含由数十个45S rDNA单位组成的核仁组织区NOR(图1B),根据NOR和端粒序列设计FISH探针(pITS1、pITS2和pTEL),验证了12对染色体每个末端都存在端粒区域,并且12对染色体中有一对NOR(图1 C)。
HiFi、ONT和NGS reads的回比率分别达到99.55%、99.91%和97.86%,基因组中所有染色体的覆盖度均超过99.9%。Pore-C热图验证基因组组装的连续性较好,LAI指数为15.99,达到参考基因组标准。基因组组装的完整性较好,BUSCO比对率为99.4%。
图 1 牛油果T2T基因组圈图和端粒区域验证
2. 着丝粒特征鉴定
通过迭代鉴定和聚类的方法确定了12个染色体特异性的着丝粒重复序列(CSCR)。根据聚类结果,CSCR01可以作为代表性的着丝粒单体(图2)。由于这些着丝粒区域HiFi和ONT reads覆盖率较低,因此使用一致的CSCR序列,设计FISH探针(pCEN)鉴定其存在。通过比对CSCR01序列与转座子序列,发现CSCR与转座子之间存在显著相似性,表明转座子插入事件在牛油果的着丝粒结构形成中扮演重要角色。
图 2 牛油果基因组着丝粒鉴定和聚类
3. 结构变异分析
通过鉴定哈斯牛油果和西印度牛油果的基因组结构变异(SVs),发现在着丝粒附近存在大规模的结构重排(图3)。在西印度牛油果基因组4373个基因的外显子区域中,共检测到5700个插入/缺失突变(InDels),其中大部分基因与蛋白激酶、疾病抗性相关蛋白、转录因子和细胞色素P450相关。
图 3 牛油果基因组结构变异
4. NLR基因挖掘
在西印度牛油果中鉴定了376个 NLR基因,这些基因分散在整个基因组中(图4 A)。根据结构域将这些基因分为3个亚家族(CNL、TNL和RNL),其中CNL亚家族的成员数量占总数的96.54%(图4 B),154个成员与“植物-病原体相互作用”(ko:04626)通路相关联。这些家族成员的表达模式在不同的组织中存在差异,茎中的表达水平整体高于叶片和果实(图4 C),且同源基因之间表达模式也存在多样化,表明了牛油果NLR基因之间的功能多样性和同源基因之间的功能分化。
图 4 牛油果NLR基因家族分布和系统发育分析
5. 脂肪酸生物合成途径基因的表达分析
鉴定了脂肪酸生物合成途径相关的128个基因,其中48个与脂肪酸在质体中的从头合成相关,80个与内质网中的三酰甘油(TAG)的形成相关(图5)。不同脂肪酸合成途径的基因在不同组织中表达量各不相同,编码丙酮酸脱氢酶(PDH)、乙酰辅酶A羧化酶(ACCase)和丙二酰单酰CoA:ACP转酰酶(MCMT)的基因在果实中表达量最高;而催化C18不饱和脂肪酸合成的硬脂酰-ACP脱氢酶(SADs)的基因在叶子中的表达最高。在果实中高水平表达的基因可能影响牛油果中的脂肪酸组成和含量。
图 5 牛油果脂肪酸生物合成途径基因表达分析
总结
本研究采用多种测序技术,组装了无间隙的牛油果 T2T 水平基因组。新发现了12号染色体上的一个核仁区,并阐明了牛油果着丝粒的结构特征。在牛油果基因组中鉴定了 376 个 NLR 基因,并从中筛选出与牛油果疾病响应分子机制相关的关键基因。此外,还鉴定出了与脂肪酸生物合成途径相关的 128 个基因,这些基因的差异表达模式为我们理解牛油果的脂肪酸生物合成提供了宝贵见解。
参考文献:
1 Yang, T. et al. A telomere-to-telomere gap-free reference genome assembly of avocado provides useful resources for identifying genes related to fatty acid biosynthesis and disease resistance. Horticulture Research, uhae119 (2024).