文献解读|单倍型基因组和重测序揭示现代月季起源和育种历史
英文标题:Haplotype-resolved genome assembly and resequencing provide insights into the origin and breeding of modern rose
发表时间:2024.10.11
发表期刊:Nature Plants
影响因子:15.8
2024年10月中国农业大学在《Nature Plants》杂志在线发表了题为Haplotype-resolved genome assembly and resequencing provide insights into the origin and breeding of modern rose的研究成果。高俊平教授、马男教授和费章君教授为文章的共同通讯作者。张钊教授、杨拓博士、刘洋博士、吴杰博士,吴珊博士,孙宏贺博士,李永红教授为该论文的共同第一作者。该研究首次实现了对四倍体现代月季“萨曼莎”单倍型基因组的高质量组装,通过对233个蔷薇属野生种和月季栽培种的重测序,明确了现代月季(Rosa hybrida)的起源及育种过程,鉴定了现代月季驯化过程中农艺性状相关的关键基因。
研究背景
中国是蔷薇属植物最重要的起源中心,以光叶蔷薇、香水月季等为代表的野生种栽培和驯化,形成了中国古老月季类群。在欧洲地区,法国蔷薇等也通过栽培和杂交,构成了欧洲古老月季类群。长期的反复杂交导致现代月季遗传背景相对单一,传统杂交方式很难获得进一步突破性的优异新品种,因此亟需通过现代基因组学手段厘清其起源和驯化过程,从而为开展高效的基因组选择育种和定向分子育种奠定基础。
主要研究结果
1. 现代月季“萨曼莎”基因组组装和注释
研究团队前期通过基因组调查和流式细胞实验,预估现代月季的基因组大小为1.91 Gb-2.13 Gb。随后采用ONT ultra-long (237 Gb)、HiFi (103 Gb)、Pore-C (43Gb)、Hi-C (543 Gb)等多种测序技术相结合的策略,对四倍体现代月季“萨曼莎”(Samantha,2n=4x=28)进行基因组组装。其中,ONT ultra-long、HiFi和Hi-C用于基因组组装和分型,组装结果经过Pore-C技术解析染色体的远距离相互作用,将contig挂载到28条假染色体上,最后使用Hi-C数据对挂载结果进行人工校正(图1)。最终组装的基因组大小为1.97 Gb,N50大小为70 Mb,基因组组装的LTR指数为21.93,BUSCO评估结果为98.7%。对基因组进行注释后,发现重复序列占比59.32% (其中LTR-RTs占比最高39.02%),预测出141,827个蛋白质编码基因,其中有130,192个(91.79%)可以被注释为具有功能的蛋白质。
图 1 “萨曼莎”基因组组装的Pore-C和Hi-C互作热图
2. 现代月季的起源
针对现代月季复杂群体结构和遗传组成问题,研究团队对215个野生种、过渡品种(中国和欧洲老品种的杂交品种)和现代品种进行了全基因组重测序,并结合已经测序的18个品种,系统解析了月季的遗传组成。通过鉴定的SNP构建了233个月季品种的系统进化树,进一步通过种群结构分析,推断了现代月季可能的6个祖先种群的起源(图2)。
图2 月季的种群结构分析。a: 233份月季系统发育树,Hyb,现代品种;Int,过渡品种;Syn,合柱组;Chi,月季组;Rosa,蔷薇组;Can,犬蔷薇组;Cin,桂味组;其他组,包括芹叶组、小叶组、金樱子组、硕苞组和木香组。b: 月季PCA图。c:群体结构分析。d:月季的花型变化。e:月季6个潜在祖先种起源分布
另外,研究团队对现代月季“萨曼莎”基因组与6个潜在祖先种的基因组进行比较,推断现代月季的28条染色体起源。结果显示现代月季基因组中最大比例来源于大花香水月季,占基因组序列的18.25%,除了chr7b以外每一条染色体都来自于不同的祖先,表明在现代月季基因组中存在广泛的同源交换和基因渗入,与现代月季的节段异源多倍体的性质一致(图3)。chr7b主要来源于腺果蔷薇,其染色体明显短于其他三条同源染色体,这可能是缺乏同源交换的原因。此外,研究团队通过7号同源染色体之间的共线性,发现同源染色体之间存在大片段倒位,并通过Pore-C验证了这种倒位的存在(图4a 蓝色箭头,图4b)。
图 3 现代月季的28条染色体遗传结构
图 4 现代月季的7号同源染色体之间的Pore-C互作热图
3. 现代月季育种中的人工选择
为了研究在月季育种过程中受到选择影响的基因组区域,研究团队对现代品种(Hyb4)和过渡品种(int4)之间进行了选择消除分析,结果显示过渡品种的核苷酸多样性高于现代品种(图5a),反映了人类选择在品种改良过程中的作用。此外,过渡品种表现出比栽培品种更快的连锁不平衡衰减速度(图5b),再次支持了近期形成的现代品种遗传多样性的降低。根据核苷酸多样性和群体固定系数Fst,在现代月季的基因组中确定了44.42 Mb的选择区域,这些区域涉及连续开花、花序分生组织与花器官发育、花色、衰老、生长、抗病性以及皮刺形成等关键性状相关的基因,如ACOs、AP2L和KSN等(图5c)。
图 5 现代月季选择性清除分析
总结
本研究首次构建了一个高质量的现代月季“萨曼莎”的单倍型基因组,通过对200多个蔷薇属野生种和月季栽培种的重测序,明确了现代月季的起源及育种过程。这标志着在现代月季基因组组成、变异以及重要农艺性状遗传解析方面取得了重要突破,为未来现代月季基因组选择育种和分子定向育种提供了坚实的理论基础,为后续的月季比较基因组和进化分析提供资源。
参考文献:
Zhang, Zhao, et al. "Haplotype-resolved genome assembly and resequencing provide insights into the origin and breeding of modern rose." Nature Plants (2024): 1-13.