经典案例
大规模纳米孔全基因组测序揭示序列变异驱动CpG甲基化与基因表达的相关性 (Nature Genetics, lF=31.7)
在人类和其他脊椎动物中,DNA的CpG二核苷酸可被甲基化形成 5-mCpG,DNA调控序列通常缺乏CpG甲基且转录因子结合可影响甲基化状态,从而调控基因表达,但CpG甲基化与基因表达的相关性是否由序列变异直接驱动尚不明确。本研究使用纳米孔测序技术对大量个体全血样本进行分析,探究序列变异与二者关系。
纳米孔测序揭示CpG甲基化模式
研究使用纳米孔测序技术对7179名个体的全血样本进行全基因组测序,平均覆盖深度为 20.6x。鉴定出1530万个CpG甲基化位点,发现CpG 甲基化在启动子和增强子等功能区域中显著减少,且这些区域与转录因子结合相关。
序列变异驱动CpG甲基化
通过分析63460名冰岛人的基因组数据,鉴定了162万个CpG与102万个序列变异相关,其中704474个为单核苷酸多态性(SNPs)。研究鉴定了77789个甲基化缺失序列(MDSs)与80,503个等位基因特异性甲基化数量性状位点(ASM-QTLs)相关。多数 ASM-QTLS 常见且与个体 CpG 相关序列变异连锁不平衡强。
ASM-QTLS主导基因表达调控
对 896 个样本 RNA 测序,发现1103个mRNA与957个MDSs形成1513个关联。ASM-QTLs与转录因子结合位点显著对应。研究发现ASM-QTLs解释的mRNA表达变异比例显著高于MDSs的CpG甲基化。例如,VAMP5基因的ASM-QTL解释了35.9%的mRNA表达变异,远高于CpG甲基化的23.7%。
ASM-QTLS在性状和疾病中的富集
ASM-QTLS在血液学性状相关的序列变异中显著富集(40.2倍),并与多种疾病相关变异存在强连锁不平衡。例如,与2型糖尿病相关的rs34329895与PLEKHM5基因启动子甲基化的ASM-QTL rs35735821存在强连锁不平衡。
结论
本研究揭示了ASM-QTLs是CpG甲基化与基因表达相关性的主要驱动因素。ASM-QTLs通过影响转录因子结合或直接调控CpG甲基化,进而影响基因表达,并在人类表型多样性和疾病风险中发挥关键作用,特别是在血液学性状和疾病相关序列变异中高度富集。研究结果为理解基因调控机制和疾病发生提供了新的视角,并为未来的疾病研究和治疗提供了潜在靶点。

参考文献
Stefansson, O.A., et al. The correlation between CpG methvlation and gene expression is driven by sequence variantsNature Genetics.2024