基于Nanopore的全基因组重测序研究应用详解
自然界中生物信息一般以“DNA→mRNA→蛋白质→细胞→器官→个体→群体”的方向进行流动,生物因与环境相互作用而造成的表型的改变亦不相同,这种改变往往可以在基因变异上表现出来。测序技术的发展是人类对基因研究的转折点,使人类对基因组的研究从“盲人摸象”阶段走向更宽广与更精确的方向。全基因组重测序(Whole Genome Sequencing,WGS)是对已知基因组序列的物种进行不同个体的基因组测序,并在此基础上对个体或群体进行差异性分析。目前此技术已经广泛应用于医学领域,主要应用方向有寻找肿瘤突变位点及药物靶点识别,遗传疾病突变检测等方向。
图1.ONT-WGS技术路线
什么是ONT-WGS测序
近年来,基于二代测序技术(NGS)的全基因组测序(WGS)和全外显子测序(WES)运用越来越广泛,然而,受限于其技术特点(读长较短、具有GC偏好性),在研究复杂片段时有较大的局限性。ONT-WGS测序是采用Oxford Nanopore Technologies(ONT)公司的Nanopore测序技术,对样本的全基因组进行测序。
产品优势
-
长读长,单Reads长度最高可达4 Mb以上;
-
基于电信号识别,无复杂的光学成像系统,可直接测序;
-
无偏倚测序,无PCR引入的GC偏好性;
-
实时测序,随时读取随时分析。
研究案例一
2023年2月,发表在Plos Genetics上的文章利用ONT测序平台,对结直肠癌(CRC)进行长读长测序,精准检测每个样本的SV,对SV进行分析后发现CRC中有扩展的LINE和SINE插入,并且利用长读长的优势鉴定到了新的融合基因。
技术平台:PromethION 17X
实验材料:样本来源为21名CRC II期或III期的患者的肿瘤组织和距离肿瘤大于6 cm的肠道组织。
原文链接:https://journals.plos.org/plosgenetics/article?id=10.1371/journal.pgen.1010514
文章亮点:
(1)短读长测序在检测长、复杂或重复区域定位的结构变异(SVs)方面效率低下,很多未被检测到的SV可能被错过,这些未被发现的结构变异可能是个性化医疗中被忽视的可药物靶点。长读长测序能够对整个片段进行测序,无需打断引入不必要的测序数据损失。
(2)长读长测序提升了对基因组的解析度,能够鉴定出一种新的基因融合,作者认为这种融合增强了结直肠癌的转移能力。
文章结果:
作者研究发现,结构变异是导致结直肠癌(CRC)的一个重要原因,然而使用短读长测序无法有效检测到这些SV,这可能导致无法鉴定到潜在的药物靶点。利用长读长的纳米孔技术,在21名结直肠癌患者中发现了5200个新的体细胞结构变异(每名患者平均494个结构变异)。特别是在检测大规模倒位时,长读长测序提供的数据量远远超过短读长测序(图2)。
图2.CRC突变位点
这些倒位涉及到关键肿瘤抑制基因CFTR(CFTR中11.2 kb倒位)和APC的表达或结构改变(跨越APC外显子1的4915 kb倒位),这些在先前的短读长数据中均尚未有报道。
图3.跨越APC外显子1的4915 kbp倒位
图4.CFTR中11.2 kbp倒位
作者还发现了一种新的融合基因RNF38-RAD51B,其中RNF38的内含子3与RAD51B的内含子8连接在一起,这种融合的形成可能改变RNF38的功能。据报道,RNF38是癌症进展的重要驱动因素,能够促进癌细胞的侵袭和转移,这种新发现的融合基因可能会增强CRC细胞的致癌潜能。
图5.RNF38-RAD51B基因融合
研究案例二
2021年11月,发表在Genomics上的文章首次采用Nanopore测序技术与三代信息分析技术结合的方式,对肝癌中病毒整合的完整模式进行研究,直观地解析出病毒整合插入的完整序列,以及两端端点与结构变异的密切关系,确定了乙型肝炎病毒(HBV)的整合模式,为通过基因编辑技术敲除HBV序列提供了依据,也为病毒整合机制研究提供了新的导向策略。
测序平台:PromethION 18.6X
实验材料:样本来源为20个肝癌患者的癌症组织
原文链接:https://www.sciencedirect.com/science/article/pii/S0888754321004079
文章亮点:
(1)HBV在HCC细胞中具有稳定的存在形式。
(2)HBV病毒整合常伴随着基因组结构的频繁变化。
(3)TERT区域可能存在至少两种整合模式,且都包含完整的PreS1区域。
(4)作者通过对HBV与HPV病毒的共享基因的研究中发现,存在大量的共享基因在吗啡成瘾、卵巢甾体生成等神经系统有关通路中呈现显著富集状态,以此推断这两种病毒整合事件都与患者的神经信号传导状态密切相关。
文章结果:
所有HBV序列的平均深度为70.5 X,有整合位点的 HBV序列平均深度为34.9 X,具有完整病毒整合模式的HBV序列平均深度为18.6 X。通过对HBV进行更深入的比较,发现HBV整合事件中,有整合位点的片段占全部HBV片段的49.5%,揭示HBV在HCC细胞中具有稳定的存在形式。
图6.HBV覆盖率和深度
HBV整合事件中,0~1 Kb的短插入占总插入事件的50%,大于3 kb的长插入事件占25%(图7a),且不同区域形成的断点中HBV插入长度不同(图7b)。56%的HBV整合事件两端存在染色体易位现象,提示HBV病毒整合常伴随着基因组结构的频繁变化。此外,病毒整合还会导致基因组序列的频繁缺失,这为HBV整合导致基因组不稳定提供了更直接的证据。
图7.HBV插入长度和基因组结构变异
病毒DNA的整合是随机的,可以发生在任何一条染色体上。前人研究表明,在所有HBV整合事件中,发生频率最高的是5号染色体短臂上的TERT基因。针对此热点区域,作者进行了有关HBV整合模式的研究。结果表明,TERT区域至少存在两种整合模式,插入序列分别为4043 bp与2600 bp(图8 a、b),都包含完整的PreS1区域。同时,作者对HBV整合事件的其他热点区域进行了研究。结果表明,KMT2B区域上的插入序列长度为713 bp,包括完整的X区域(图8d);染色体(Chr16/Chr17)的插入序列长度为1520 bp,包含完整的X与C区域(图8c);DNAH9区域的插入序列长度为5048 bp,包含完整的HBV全长序列(图8 f)。
图8 热点区域HBV整合模式
研究案例三
2022年5月,浙大医学院发表在Nature Communications上的文章采用长读长测序的方式揭示宫颈癌中HPV高分辨率整合及其致癌进展采用Nanopore测序法对HPV16型阳性的宫颈癌样本进行测序,发现四种不同类型的HPV-DNA整合模式,揭示HPV在宫颈癌中的精细整合结构及HPV整合的潜在肿瘤内异质性机制。
测序平台:PromethION 34X
实验材料:样本来源为16例HPV16型阳性的宫颈癌患者的癌症组织
原文链接:https://www.nature.com/articles/s41467-022-30190-1
研究亮点:
(1)宿主基因组中,HPV基因组整合位点往往成簇存在;
(2)同一整合位点下,可能同时存在多种不同的整合变异事件;
(3)长读长测序可以鉴定一系列的染色体间易位变异;
(4)HPV基因组可能充当“剪刀”的角色,将宿主基因组与HPV基因组各取一部分整合成eccDNA结构,而这些特殊结构可能在癌症发生、发展过程中具有重要的作用。
文章结果:
为了深入了解HPV整合,对16例HPV16阳性的原发性宫颈癌进行了纳米孔长读长基因组测序,发现整合断点分散在人类和病毒的整个基因组中(图9)。在HPV整合事件中,E1或E2基因(癌基因E6和E7的负调控因子)发生整合的优先级较高,这可能导致癌蛋白E6和E7的失调,从而促进宫颈癌的发生。
图9.整合断点在人类和病毒基因组中的分布
高危型HPV-DNA整合到宿主基因组中是宫颈癌发生过程中的一个至关重要的分子事件。这些整合的HPV-DNA片段可分为四种类型:A型代表含有E6/E7基因的截短型HPV基因组(图10a);B型是一个截短的HPV基因组,缺乏E6/E7基因(图10b)。C型是一个溢出的连续片段,包含完整的HPV基因组(图10c)。与A型和B型相比,C型整合了至少一个完整的HPV基因组和部分HPV基因组,其中E1和E2基因在某些情况下似乎也是完整的。D型涉及A型、B型或C型的组合(图10d)多种类型的整合HPV-DNA片段经常出现在单个肿瘤中,这表明宫颈癌症中HPV整合的多样性和复杂性。
图10.HPV-DNA整合的四种模式
HPV-DNA片段两侧的宿主衍生片段在人类基因组中端对端逆转(图11a)。可以推测这种结构的两个潜在机制。在第一种情况下,两个侧翼的人类序列都会发生断裂和反转,导致两个染色体重排,中间穿插着病毒序列。在第二种情况下,整合的HPV-DNA片段的两端与两侧的人类序列连接,形成ECC病毒-人类杂交DNA结构(图11b)。此外,根据DNA碱基覆盖率对宿主基因组上的相关区域进行了局部扩增,随后通过PCR进行了验证(图11c),表明ECC病毒-人类杂交体及其自主复制的存在。
图11.染色体外环状病毒-人类DNA结构.
总 结
从上述文章分析发现,研究内容可集中于以下几方面:
-
已有QTL区域的SV检测,causal variation的重新定位;
-
基于SV的群体进化分析;
-
研究由基因插入或缺失引起的疾病的病因及致病机理;
-
鉴定遗传突变。