宏基因组文献解读|IF=48!mEnrich-seq——对微生物组中感兴趣的细菌的甲基化引导富集的测序
简介
mEnrich-seq(其中“m”代表甲基化,“seq”代表测序)新型测序方式可预先富集宏基因组特定类群,利用细菌甲基化差异,特异性去除背景DNA,高效富集目标菌群。本研究从尿粪样本中显著富集(最高达117倍)难培养及低丰度致病/益生菌,对4601个细菌甲基组分析发现约68%基因组适用至少一种酶进行mEnrich-seq,覆盖54.78%的物种。
英文标题:mEnrich-seq: methylation-guided enrichment sequencing of bacterial taxa of interest from microbiome
中文标题:mEnrich-seq——对微生物组中感兴趣的细菌的甲基化引导富集的测序
发表期刊:Nature Methods
影响因子:48
发表时间:2024年01月
作者及单位:房刚团队,美国纽约西奈山医学院
技术路线
图1 mEnrich-seq的工作流程及应用思路
a、 mEnrich-seq工作流。
1.用g-TUBE将宏基因组DNA样品剪切至目标片段大小;2.连接barcode和接头;3.用一个或多个RE(甲基化敏感限制酶,绿色剪刀)处理DNA分子,这些RE切割非甲基化基序位点(绿色圆圈),留下完整的甲基化基序列(填充的绿点);4.纯化回收高分子量的DNA分子;5.PCR扩增;6.文库制备后测序。
b、 使用具有不同RE的mEnrich-seq来检查来自同一微生物组样本的不同细菌分类群。
部分主要结果
1. 基于甲基化富集感兴趣的细菌类群
图2 mEnrich-seq的验证
mEnrich-seq将大肠杆菌(目标菌)的测序reads比例从0.91%-1.20%大幅提升到70.75%-71.41%(图a),富集效率增加约70倍(图b);富集数据对两个模拟样本的大肠杆菌基因组的覆盖度达到99.96%以上(图c)。该结果,有效展示了在模拟样本中mEnrich-seq对目标菌的较高的富集效率。
图2 mEnrich-seq的验证
mEnrich-seq结果显示,3.98%-4.12%的reads源自淋病奈瑟菌背景菌,90%以上此类reads无GATC位点,能耐受DpnII酶切和PCR扩增;约5%的reads含与淋病奈瑟菌甲基化基序GGTG6mA重叠的GATC位点,避免了DpnII消化;余下部分可能是由SNPs或测序误差导致(图2d)。
在与人基因组比对的reads中(图2e),多数具有GATC位点的reads位于富含简单序列重复区域,这些区域易形成二级结构,不利于DpnII酶的切割。
图2 mEnrich-seq的验证
对尿路感染患者的三个尿液样本(UTI-1、2、3)的mEnrich序列分析,三个样本的大肠杆菌读数都显著增加:UTI-1的8.7倍(从5.88%增加到51.14%),UTI-2的116.8倍(从0.77%增加到90.00%),UTI-3的3.8倍(从24.79%增加到93.59%)(图2f、2g)。
图2 mEnrich-seq的验证
本研究还根据与大肠杆菌分离株的从头组装基因组的比较,从富集测序中回收的大肠杆菌基因组的完整性方面评估了mEnrich-seq。在所有三个样本中,mEnrich-seq reads对大肠杆菌基因组的覆盖均超过99.97%(图2h)。
2. 富集肠道菌群中的A. muciniphila
图3 mEnrich-seq富集肠道菌群中的A. muciniphila
将mEnrich-seq与RE-XapI(消化非甲基化RAATTY位点)一起应用,以耗尽背景DNA并从粪便微生物组中富集A.muciniphila。研究结果显示,GUT-1中A.mucinipila的reads增加了20.0倍(从0.48%到9.59%),GUT-2增加了27.2倍(从0.52到14.16%),GUT-3增加了18.3倍(从1.52%到27.88%)(图3a、3b)。
图3 mEnrich-seq富集肠道菌群中的A. muciniphila
mEnrich-seq reads 对粘球菌基因组的覆盖度达到99.7%以上(图3c),对于A.muciniphila,mEnrich-seq reads与参考基因组的RAATTY频率相当(图3d),这与其基因组上甲基化RA6mATTY基序的富集一致。相反,RAATTY在双歧杆菌、产气荚膜梭菌和长肠杆菌中的频率较低,这三个物种的mEnrich-seq reads进一步降低(图3d)。
3. 低丰度菌的选择性测序
图4 基于新发现甲基化基序的菌进行富集
前面展示了mEnrich-seq对已知甲基化基序的菌的富集效果。接下来以Denovo甲基化基序为基础(图4a),对成人粪便微生物样本(GUT-5)中低丰度菌进行富集,获得了比较理想的富集结果:对A.finegoldii H10的富集达8.7倍(从1.12%到9.73%),对B.ovatus C6的富集达3.1倍(从1.62到5.05%),对B.longum F12的富集达8.7倍(从1.17%到10.17%),对B.longum D10的富集达7倍(从0.32%到2.24%)。
特别的是,D.longicatena和B.intestinihomei共享甲基化基序G6mATGC(反向链GC6mATC),用SfaNI作为RE的mEnrich-seq分别提供了D.longicatena(从0.39%到17.10%)和B.intestinihomei(从0.71%到21.34%)的43.8倍和30倍的富集效果(图4b)。
图4 基于新发现甲基化基序的菌进行富集
将SfaNI(靶向GATGC)和另外五个靶向CTNNAG基序的RE结合到mEnrich-seq测定中,实现了对B.intestinihomei 85倍的富集(从0.71%到60.47%)效率,表明mEnrich-seq与靶向多个基序的REs的组合可以极大地提高特定菌株的富集效率(图4b、4i)
进一步分析成人粪便样本GUT-5和GUT-6,并将mEnrich-seq组装的几个目标物种的基因组与标准宏基因组测序进行比较,发现与标准宏基因组测序相比,mEnrich-seq显著改善了基因组组装(图4j)。
4. mEnrich-seq的普适性评估
图5 mEnrich-seq的普适性
对4601株细菌进行分析发现平均每个细菌甲基组中有三个甲基化基序(图5a),基序中非变性碱基的数量从2个到9个不等,大多在4个到8个之间(图5b)。
图5 mEnrich-seq的普适性
对4601个已知甲基组的细菌菌株系统发育树分析,发现其中3130个菌株至少含一个甲基化基序,具有广泛的分类多样性(图5c),且至少含有一个甲基化基序的菌种占本分析中菌株物种的54.78%。一些RE具有非常广泛的用途,因为它们的靶基序在大量细菌基因组中被甲基化(图5d、5e)。
参考文献:
Cao, L., Kong, Y., Fan, Y. et al. mEnrich-seq: methylation-guided enrichment sequencing of bacterial taxa of interest from microbiome. Nat Methods 21, 236–246 (2024).