基于Nanopore的全基因组甲基化分析应用详解
生物遗传信息的流动是由DNA→RNA→蛋白质的,当这三种任意一个发生改变都有可能导致疾病的发生。但有部分疾病并没有发生DNA或RNA序列上的突变,而是由于基因组发生了化学修饰而引起的疾病。DNA甲基化(DNA methylation)是DNA化学修饰的一种形式,能够在不改变DNA序列的前提下,改变遗传表型。甲基化疾病的症状和表现因疾病类型和患者个体差异而有所不同,常见的症状包括生长发育异常、免疫功能异常、神经系统疾病、肿瘤等。目前,甲基化疾病的确切发病机制尚不完全清楚,但已有研究表明,环境因素、遗传因素和生活方式等因素都可能与甲基化疾病的发生发展相关。
图1 甲基化发生因素
什么是ONT全基因组甲基化测序?
全基因组甲基化测序是一种用于研究DNA甲基化模式的高通量测序技术。通过全基因组甲基化测序,可以对整个基因组中的甲基化位点进行高分辨率的检测和定量分析。全基因组甲基化测序的原理是利用测序技术对DNA进行测序,并结合生物信息学分析方法来确定DNA上的甲基化位点。这种技术可以帮助研究人员了解细胞和组织中DNA甲基化的分布模式,揭示甲基化在基因表达调控中的作用机制,发现与疾病发生相关的甲基化变化等。ONT-WGBS测序是采用Oxford Nanopore Technologies(ONT)公司的Nanopore测序技术,对样本的全基因组进行测序,并且附带基因组甲基化信息的一种全新的测序方式。全基因组甲基化测序技术的发展为研究DNA甲基化提供了强大的工具,有助于深入理解基因组的表观遗传学调控机制,并在疾病诊断、治疗和预防方面发挥重要作用。
图2 ONT全基因组甲基化测序技术路线
产品优势
-
长读长,单Reads长度最高可达4 Mb以上;
-
基于电信号识别,无复杂的光学成像系统,可直接测序;
-
无偏倚测序,无PCR引入的GC偏好性;
-
实时测序,随时读取随时分析;
-
同时进行DNA甲基化分析。
研究案例一
2022年4月发表在Molecular Science上的文章,利用ONT测序平台,对肿瘤基因组的甲基化进行检测,鉴定出10个可能的肿瘤抑制基因,最终筛选锁定葡萄糖激酶 (GCK) 进行功能表征验证。
技术平台:MinION 3X
实验材料:HepG2、Huh7、C3A 和 HLF 细胞(肝癌细胞系)
原文链接:https://www.mdpi.com/1422-0067/22/8/3937
文章亮点:
采用甲基化数据,结合重生肝组织和原代肝细胞癌样品的转录组图谱信息,一共鉴定出10个可能的肿瘤抑制基因,最终筛选锁定葡萄糖激酶 (GCK) 进行功能表征验证。
研究结果:
利用ONT平台对HCC细胞系 (HepG2) 进行测序,并和HepG2细胞的全基因组亚硫酸氢盐测序 (WGBS) 数据进行比较分析,如图3A所示,ONT测序的甲基化信号与 WGBS的甲基化信号具有良好的相关性。ONT测序数据发现甲基化水平在转录起始位点 (TSS) 下降(图3B),ONT测序数据和WGBS数据分别检测到3332和5099个基因的3711和7013个高甲基化启动子(图3C)。
图3 ONT测序与WGBS性能对比
研究案例二
2024年2月发表的文章采用ONT测序对老年人额叶皮层样本进行全基因组甲基化测序,揭示了潜在的体细胞插入变异,并为逆转录转座子家族的DNA甲基化频率提供了信息;确定了病理正常大脑与阿尔茨海默病患者之间DNA甲基化显著差异。该研究分析了阿尔茨海默病神经病理学患者衰老大脑中的逆转录转座子序列、结构变异和DNA甲基化,为阿尔茨海默病的形成机制提供了支持。
技术平台:PromethION 7.38X
实验材料:本研究中使用的18个人类额叶皮层样本的年龄和性别匹配,平均年龄为76.6岁。从6名无神经退行性变临床或病理诊断的个体(Braak 0)、6名Braak III期个体和6名临床诊断为阿尔茨海默病的Braak V/VI期个体的死后额叶皮层分离细胞核中提取DNA。
预印本,Biorxiv
https://www.biorxiv.org/content/10.1101/2024.02.01.578450v1.abstract
文章亮点:
(1)作者将组织匀浆后采用蔗糖梯度离心分离细胞核后提取DNA
(2)采用Nanopore法对基因组进行测序,对转座子插入、SV、5mC位点、甲基化差异进行分析
研究结果:
借助TLDR工具分析18个人脑样本中的反转录转座子序列,共检测到4645个非参考逆转录转座子插入,其中97%包含串联位点重复;进一步分析后找到1044个“新型”逆转录转座子,其中634个是单个个体独有的。在反转录转座子家族中,我们发现SINE元件的Alu家族组成了最丰富的反转录转座子插入类,而AluYa5是最活跃的成员,这与先前的工作一致,表明AluYa5是人类中最活跃的逆转录转座子亚家族(图4A)。在检测到的非参考逆转录转座子中,大多数存在于内含子、潜在增强子区域或基因间区域(图4B)。
图4 老年人脑中的非参考基因组逆转录转座子插入
利用SNIFFELS2工具分析样本测序数据,共检测到47315个基因突变位点(81.4%,QUAL=60),最丰富的基因突变类型是插入(图5A);结构变异最常见于内含子和外显子中(图5B);基因突变的长度分布是高度可变的(图5C)。
图5 老年人脑中的非参考结构变异
为验证基于纳米孔测序的甲基化分析是否与先前报道的人类基因组中CpG位点5mC密度一致,我们对所有CpG二核苷酸的5mC模式进行了识别,并分析了它们在CpG island、shores、shelves、regions的定位(图6A)。与全基因组水平的CpG甲基化水平相比,我们发现CpG islands和一部分CpG shores具有较低的甲基化频率,与其他基因组部分相比(图6B),这与以前在人类、非人类灵长类动物和小鼠中的研究结果一致。在分析对照组、Braak III期和Braak V/VI期大脑启动子中5mC的变化时发现与对照组相比,Braak III期7852个基因的20352个独特启动子的差异甲基化,而发现5765个基因的19638个启动子在Braak V/VI期差异甲基化。与对照组相比,Braak III组大脑中的差异甲基化区域在0.25和0.75时具有更高的密度,而Braak V/VI组的大脑则转向无甲基化或完全甲基化(图6C)。值得注意的是,甲基化的变化可能代表Braak阶段之间细胞组成的变化,而不是转录调控发生改变。虽然启动子甲基化水平在对照组、Braak III和Braak V/VI脑中不同,鉴定到超过7072个低甲基化启动子,这些启动子是Braak III脑中特有的,与调节磷脂酶D、FCγ受体介导的吞噬作用、促性腺激素释放激素(GnRH)信号通路、Rap1信号通路和肌动蛋白细胞骨架调节的途径有关(图6D)。
图6 基于纳米孔的老年人脑甲基化分析
Braak III期大脑的DNA通常甲基化程度较低(图7A),而与对照组相比,Braak V/VI期大脑的脱氧核糖核酸通常高度甲基化(图7B)。与对照组相比,Braak III和Braak V/VI阶段DNA甲基化的水平变化似乎更加保守,并且与对照相比,着丝粒5mC在Braak III和Braak V/I处受影响较大(图7C,D)。
图7 阿尔茨海默病染色体间的DNA甲基化模式
总 结
从上述文章分析发现,研究内容可集中于以下三方面:
-
分析肿瘤甲基化特征,筛选肿瘤标志物,进一步分析肿瘤形成机理;
-
神经退行性疾病等慢病研究;
-
药物治疗效果追踪等。