您好,欢迎光临武汉贝纳科技有限公司
027-62435310 | service@benagen.com | 中文 | English 咨询客服
您现在的位置:主页 > 市场与支持 > 文献解读 >

Adv Sci突破性发现:SV如何改写棉花纤维品质的遗传密码

棉花(Gossypium spp.)作为全球重要的纺织原料,其纤维品质的驯化改良一直是育种研究的核心。尽管已有研究揭示了单核苷酸多态性(SNP)和表观遗传修饰在棉花驯化中的独立作用,但结构变异(SV)、三维基因组重塑与表观遗传调控之间的协同机制尚不明确。野生种尤卡坦yucatanense(Yuc)与栽培种新陆早61号(XLZ61)在纤维长度和强度等性状上存在显著差异,由此为解析驯化机制提供了理想材料。


近日,来自浙江大学棉花精准育种团队的方磊教授团队在Advanced Science期刊(IF=14.1)上发表了题为Structural Variation and 3D Genome-Driven DNA/RNA Methylation Divergence Contributing to Cotton Fiber Domestication的研究论文,研究首次完成Yuc和XLZ61的高质量基因组组装,通过三维基因组、DNA甲基化和RNA甲基化等多组学测序及分析,系统阐明了棉花纤维发育关键时期的调控网络,揭示了结构变异重塑三维基因组从而驱动表观修饰影响基因表达的级联调控新机制,为棉花分子设计育种提供了重要的理论基础和遗传资源。

企业微信截图_17721771258184


研究结果

1. 野生与栽培棉花纤维表型性状的显著差异

野生种尤卡坦Yuc与栽培种新陆早XLZ61在多个性状上表现出明显差异。在植株形态方面,Yuc对矮壮素极度敏感,导致株高显著受抑制(图1a);在纤维品质方面,XLZ61的纤维长度和强度均显著优于Yuc(图1b,c)。此外,棉铃的大小也存在显著差异,XLZ61的棉铃明显大于Yuc(图1d,e)。通过扫描电镜观察发现,在纤维起始阶段(-1、0、1、3 DPA),XLZ61胚珠表面的凸起细胞数量多于Yuc(图1f)。纤维动态伸长测量显示,两种材料在5-25 DPA期间都经历近乎线性的伸长过程,而XLZ61的伸长速率更快,并且纤维长度显著大于Yuc(图1g,h)。这些表型差异表明纤维发育过程在驯化过程中发生了重要改变。

企业微信截图_17721771943046

图1:野生与栽培棉花纤维表型性状的显著差异


2. 结构变异对三维基因组的重塑作用

通过PacBio HiFi测序和Hi-C技术,研究成功组装了Yuc和XLZ61的高质量基因组。Yuc基因组大小为2387.7 Mb,scaffold N50为108.4 Mb;XLZ61基因组大小为2333.4 Mb,scaffold N50为108.5 Mb。比较两个基因组,共鉴定出16,832个插入、18,218个缺失和165个倒位(图2a)。其中,86.6%的SV位于差异拓扑关联域(TAD)区域,表明SV在三维基因组重塑中起着关键作用。


三维基因组分析发现,大多数染色质区室保持稳定,仅4.8%的基因组区域发生A/B区室转换。差异TAD区域的基因表达变化幅度显著大于保守TAD区域。SV在差异TAD中显著富集(图2b,c),且更倾向于分布在TAD内部而非边界区域。染色体水平分析显示,SV密度与TAD结构变化密切相关。例如,染色体A01上75.9 Mb的区域(占染色体总长的64.3%)集中了大量差异TAD结构,其中75-85 Mb区间内18个差异TAD边界中有13个与SV重合(图2d)。相反,染色体A04上仅20.3%的区域存在差异TAD,且SV密度较低(图2e)。同时全基因组分析显示55%的TAD边界与SV相关,证实SV通过改变染色质空间结构影响基因调控。

企业微信截图_17721772282127

图2:结构变异对三维基因组的重塑作用


3. DNA甲基化在驯化过程中的重编程

通过全基因组DNA甲基化测序及分析发现,CG甲基化在所有样本中占主导地位,并且甲基化位点主要富集分布于异染色质区域。基因功能区域分析表明,启动子区域的DNA甲基化水平高于蛋白质编码区域,同时转座元件(TE)区域的甲基化水平高于非TE区域。差异甲基化区域(DMR)分析共鉴定出84,563-92,983个CG-DMR、76,254-101,494个CHG-DMR和16,863-159,844个CHH-DMR。CG-DMR和CHH-DMR主要分布在染色体末端的蛋白质编码基因附近,而CHG-DMR在染色体上均匀分布。GO富集分析显示,差异甲基化基因显著富集于离子稳态、微管运动、细胞骨架组织等与纤维发育密切相关的生物学过程。


4. RNA甲基化修饰的动态调控网络

通过纳米孔直接RNA测序,在全基因组水平共鉴定出161,651个(Yuc)和170,929个(XLZ61)m6A修饰位点,以及3,438,320个(Yuc)和3,628,677个(XLZ61)m5C修饰位点(图3a,c)。同时,大多数转录本含有少于3个m6A位点或10-50个m5C位点(图3b,d)。


此外研究还发现,存在m6A或m5C修饰的转录本表达水平显著高于未修饰转录本,且修饰位点越多,表达水平越高(图3e-h)。其中共修饰转录本(同时含有m6A和m5C修饰)的表达水平最高(图3i,j),说明两种修饰可能存在协同效应。差异RNA甲基化分析发现,纤维素合成酶基因(CesA、COBAR)等在XLZ61中RNA修饰水平降低且表达下调;而乙烯合成通路基因(ACC、ECR等)修饰水平升高且表达上调(图3k)。由此表明RNA甲基化通过调控糖代谢通路关键基因的mRNA稳定性,在纤维发育中发挥重要作用。

企业微信截图_17721772674187

图3:RNA甲基化修饰的动态调控网络


5. SV通过表观遗传修饰调控基因表达

研究进一步探究了SV通过影响表观遗传修饰来调控基因表达的具体机制。将同时含有InDel和DMR的基因定义为“InDel-DMG”基因,这类基因的表达变化幅度显著大于仅含DMR或仅含InDel的基因(图4a,b)。此外,研究还定义了一类由InDel直接引入的“获得性甲基化区域”(AMR),这类甲基化差异主要源于SV片段自身携带的表观遗传修饰。


倒位变异也能通过改变TAD边界影响甲基化水平。例如,A06染色体上一个32 Mb的大片段倒位(图4c)导致边界区域A/B区室状态和TAD结构发生改变(图4d-f),进而影响DNA甲基化模式。在该倒位区域的差异TAD中,GH_A06G1342、GH_A06G1344和GH_A06G1345等基因在10 DPA时期表现出显著表达差异,且同时存在DNA和RNA甲基化水平的改变(图4g)。同时这些基因在半野生材料中的表达模式与XLZ61一致,表明该倒位可能在早期驯化过程中受到选择。

企业微信截图_17721773112175

图4:SV通过表观遗传修饰调控基因表达


6. 多层级调控网络共同决定纤维长度性状

为了阐明复杂性状变异的遗传基础,研究构建了包含586个个体的F2群体,通过BSA-seq和高密度遗传图谱(包含13,602,620个SNP位点)进行QTL定位,鉴定出一个新的纤维长度QTL位点qFL/A07(图5a),该区间包含76个SV、4个差异TAD、151个DMR和1432个RNA差异甲基化位点(图5b)。


进一步分析发现,GH_A07G0948基因启动子区的一个1,497 bp插入(图5c)引入了一段甲基化序列,该插入片段被注释为一个PAV基因GH_A07G0947,可在XLZ61材料中表达。同时这个PAV基因携带的甲基化修饰抑制了下游GH_A07G0948基因的表达(图5d)。F2群体基因型分析显示,携带该SV的个体纤维长度显著长于不携带的个体(图5e)。此外,研究还发现了主要受DNA甲基化调控的GH_A07G1036基因和主要受RNA甲基化调控的GH_A07G1046基因,进一步凸显了多层级调控网络在纤维性状驯化中的协同作用。

企业微信截图_17721773555851

图5:多层级调控网络共同决定纤维长度性状


研究结论

本研究通过构建野生与栽培棉花纤维发育模型和整合多组学分析策略,成功绘制了纤维性状驯化的多维调控图谱。研究不仅证实了结构变异在三维基因组重塑中的关键作用,还深入揭示了DNA甲基化和RNA甲基化修饰在基因表达调控中的协同贡献。通过整合多组学数据,研究扩展了结构变异调控基因表达的传统认知,并首次系统解析了结构变异重塑三维基因组从而驱动表观修饰影响基因表达的级联调控机制。这些发现表明,棉花纤维性状的驯化是一个由基因组结构变异、染色质空间构象和多重表观遗传修饰共同调控的复杂网络。该研究为理解作物驯化的表观遗传基础提供了宝贵的资源和新的视角,对作物遗传改良和分子设计育种具有重要的理论和实践意义。


参考文献:

Shao L, Jin S, Jiang H, et al. Structural Variation and 3D Genome‐Driven DNA/RNA Methylation Divergence Contributing to Cotton Fiber Domestication[J]. Advanced Science, 2025: e14381.


image


image


Copyright © 2018 武汉贝纳科技有限公司 . All Rights Reserved. 鄂ICP备2021008976号-2