项目文章解读 |绿豆T2T基因组从结构变异层面为绿豆驯化机制提供见解
近日,种质资源所农作物种质资源收集保护和评价创新团队在园艺学顶级期刊Horticulture Research(IF=7.6)发表题为Telomere-to-telomere, gap-free genome of mung bean (Vigna radiata) provides insights into domestication under structural variation的研究论文。
绿豆是全球重要的一年生豆科作物,具有生长周期短、投入需求低及营养丰富等优势,种植面积约占全球豆科植物种植面积的8.5%。绿豆经过长期驯化,但其形态和生理演化的遗传机制未被完全揭示。
研究团队通过整合PacBio HiFi、Oxford Nanopore和Hi-C测序技术,首次实现了“潍绿9号”绿豆品种的端粒到端粒(T2T)、无缺口的基因组组装。组装得到的绿豆基因组大小为500 Mb,由11条染色体组成,contig N50为46 Mb,8条染色体达到T2T水平,基因组中重复序列比例为49.17%。此外,研究团队使用34个野生种和77个栽培种的重测序数据进行变异挖掘。通过整合结构变异(SV)和单核苷酸多态性(SNP)数据,团队识别出脂肪酸合成、亚油酸生物合成及苯丙氨酸代谢通路相关基因在驯化过程中经历了强烈选择。这些发现为解析绿豆驯化遗传机制、品种改良和新品种选育奠定了基础。
贝纳基因为研究提供PacBio HiFi、Nanopore和Hi-C测序服务。
绿豆T2T基因组circo图
研究团队使用 HiFi(46.2G、92.4X)、Nanopore(53.9G、107.8X)和Hi-C(64.5G、129X)测序数据组装得到了绿豆参考基因组,基因组大小为500 Mb,由11条染色体组成,contig N50为46 Mb,8条染色体达到T2T水平,基因组中重复序列比例为49.17%,其中LTR序列占30.13%。经过基因组注释,共注释得到了28320个蛋白编码基因,在TrEMBL和NR数据库中的注释率分别达到了97.72%和94.61%。

豇豆、赤小豆、绿豆的基因组分型与基因组特征
研究团队使用SubPhaser对豇豆、赤小豆、绿豆的基因组进行K-mer分析,确定了共计144,186个物种特异性的的K-mer序列。大多数物种特异性的K-mer分布在染色体的中心区域,并映射到74,772个转座元件序列中,进一步对这些转座元件的分类显示,超过99%的种特异扩增的转座元件是LTR逆转录转座子(LTR-RT)序列,与小麦等物种的先前研究结果一致。在绿豆和豇豆中,LTR扩张大约始于约790万年前,而在赤小豆中,大约始于约700万年前,表明它们在约700-800万年前分化,这与系统发育分析的结论一致。

绿豆基因组中转座元件相关分析
研究团队统计了绿豆基因组中的转座元件,发现数量最多的是Ty1/copia和Ty3/gypsy,分别发生了5,353和4,083次转座。这些特定转座元件分别插入到465个基因内部,678个基因的上游5 kb内,以及791个基因的下游5 kb内。有趣的是,研究发现这些转座元件的插入并不特定地干扰特定类别基因的功能,而主要干扰细胞高渗响应、苯甲酸代谢过程和蛋白水解的正调控等功能。研究将这些转座元件基于丰度分为四组:Ty1_copia/Ale、Ty1_copia/Ivana、Ty3_gypsy/chromovirus/Reina和TE/others,通过对受这四类转座元件影响的基因富集分析,研究团队发现了不同的转座元件具有不同的插入模式。并且结合转录组数据进行分析,研究发现这些转座元件插入到基因的上游、下游或内部显著的调控了基因表达。

栽培绿豆和野生绿豆的种群结构
研究团队通过对34个野生种和77个栽培种的重测序数据(平均测序深度33.5±9.7×)进行变异挖掘,得到115,398个SVs和3,069,438个SNPs。通过SNPs进行的群体结构分析表明,在K=2时,栽培和野生种群形成了两个明显的群体,且两个种群之间几乎没有基因交流。

栽培绿豆和野生绿豆群体基因组变异差异分析
为了评估绿豆驯化过程中受到选择的基因,研究团队以20Kb为窗口分别计算SV和SNP的FST值,最终选择具有最高FST值的最高5%窗口取其交集,从而得到206个基因,其中包括参与免疫应答中细胞激活和对共生体的防御应答的基因。同时研究团队通过XP-CLR法比较栽培群体和野生群体间受到驯化选择压力的区域,其中存在382个SV与350个基因,通过基因注释,研究团队分析这些基因显著富集于脂肪酸合成、亚油酸生物合成及苯丙氨酸代谢通路上。这些通路是植物防御和结构完整性所必需的,研究团队认为这暗示这些基因在绿豆从匍匐到直立生长形态的驯化中通过增强了植物的物理强度和抗病性扮演重要角色。
总 结
研究团队通过多种测序技术,组装得到了首个绿豆T2T水平的参考基因组,并结合栽培和野生种群的绿豆植株重测序数据,进行群体结构分析,发现在绿豆驯化过程中一些基因在驯化过程中受到了强烈选择性压力。本研究通过绿豆基因组的组装和群体遗传研究,为理解和推动绿豆驯化的遗传机制提供了宝贵见解,并为未来绿豆及相关物种的演化和育种研究奠定了基础。
种质资源所贾凯华博士为该论文第一作者,李娜娜研究员和李冠博士为该论文的通讯作者。该研究得到了山东省现代农业杂粮产业技术体系、山东省农业良种工程、国家自然科学基金、山东省自然科学基金和山东省农业科学院科技创新工程的支持。