Q1:WGBS 项目每个组别应该设置多少个生物学重复?
建议设置至少2 个生物学重复。
Q2:WGBS可以检测几种修饰类型?可以识别哪些序列背景下的甲基化修饰?
WGBS 可以识别 5mC 一种类型;可以识别 CG、CHG、CHH 序列背景。
Q3:WGBS每个样本应该测多少数据量?成本制约的情况下,WGBS 是否可以降低测序深度或者减少生物学重复?
通常要求的测序深度为基因组大小的 30X及以上;WGBS 研究中,通常涉及三个关键指标:DMR(differentially methylated regions),差异甲基化区域,即样品间甲基化程度存在差异的区段;TPR(true positiverate),真阳性率,用于评估检测的灵敏度;FDR(false discovery rate),假阳性率,用于评估检测的特异性。根据已有研究,TPR 和 FDR 在测序深度达到 10X 以上时二者的上升和下降趋势均放缓,但 DMR 的检测需要更高的测序深度(特别是当甲基化差异程度不高时)。
经典案例
多组学揭示表观遗传学调控杨树生长发育新机制 (New Phytologist,IF=8.3)
DNA甲基化是植物生长发育中基因调控的重要表观遗传修饰。然而,DNA甲基化的精确机制仍然知之甚少,尤其是在木本植物中。本研究用WGBS、ATAC-seq 和RNA-Seq 研究了毛白杨的表观遗传调控机制。
1. 5-AazC 处理影响毛白杨生长与代谢
用5-AzaC处理毛白杨的两个品种,处理后植株生长缓慢、叶片发育异常,高度和茎直径显著减少。代谢组学分析表明,脂质和酚酸含量增加,类黄酮含量减少,差异积累的代谢物主要富集在亚油酸、色氨酸代谢及类黄酮生物合成途径。
2. DNA 去甲基化影响基因表达与染色质可及性
WGBS 显示5-AzaC处理显著降低了CG、CHG和CHH的DNA 甲基化水平,DMRS主要分布在启动子区域。RNA-seq发现大量差异表达基因,上调基因主要富集在信号传导和植物激素信号传导途径中,而下调基因主要富集在能量和碳水化合物代谢途径中。ATACseq表明5-AzaC处理后染色质可及性增加,DARS 也主要分布在启动子区,表明 DNA 甲基化影响染色质可及性调控基因表达。
3. 基因转录受DNA甲基化和染色质可及性的共同调控
WGBS、ATAC-seq 与RNA-seq联合分析表明,染色质可及性与基因表达正相关,高表达基因启动子区域染色质可及性更高。联合分析在两个品种中分别鉴定出91个和 22 个受 DNA 甲基化和染色质可及性共同调控的差异表达基因,主要参与基本生物过程。eQTM 和 EWAS 分析显示,DNA 甲基化在调控基因表达和植物生长中具有重要作用。
4. PtoGntK与PtoRAP2.12 调控植物生长
QTL作图和GWAS分析发现PtoGntK与植物生长显著相关,其启动子区域SNPs位于可及区域。PtoGntK的过表达促进生长,而敲除导致生长迟缓。酵母单杂交等实验证实 PtORAP2.12结合PtoGntK启动子的去甲基化可及性区域,激活其表达,刺激植物生长。
结论
本研究揭示DNA甲基化通过调控染色质可及性影响基因表达的机制,即DNA去甲基化改变染色质可及性,影响转录因子PtoRAP2.12与PtoGntK启动子结合来调控转录、影响植物生长,为理解木本植物表观遗传调控机制及分子设计改良提供理论基础。

参考文献:
He Y, et al. Binding of PtoRAP2.12 to demethylated and accessible chromatin regions in the PtoGntk promoter stimulatesgrowth of poplar. New Phytologist. 2025