您好,欢迎光临武汉贝纳科技有限公司
027-62435310 | service@benagen.com | 中文 | English 咨询客服
您现在的位置:主页 > 市场与支持 > 文献解读 >

Nature级技术突破:纳米孔直接RNA测序实现高效多重检测,低丰度病毒RNA无处遁形

image.png

英文标题:Demultiplexing and barcode-specific adaptive sampling for nanopore direct RNA sequencing

发表期刊:Nature Communications(IF:14.7)

发表时间:2025.4.21


研究背景

纳米孔直接RNA测序(dRNA-seq)无需RNA反转录为cDNA,可直接解析RNA异构体、Poly(A)尾及碱基修饰,为转录组研究提供独特视角。然而,现有技术缺乏高效多重测序方案,限制了其广泛应用。本研究开发了WarpDemuX技术,即一种基于SQK-RNA002 和 SQK-RNA004 化学试剂,可通过原始电流信号快速解析拆分的barcode混样测序方法。通过使用12个RTA barcode在单张芯片中实现SARS-CoV-2病毒株快速表型分析,揭示了感染过程中亚基因组RNA丰度与Poly(A)尾长动态调控规律。结合自适应采样技术,WarpDemuX成功富集了低丰度病毒RNA,并在SQK-RNA004化学试剂中保持高性能。该技术为dRNA-seq提供了一种经济高效的多重测序解决方案,推动表观转录组学研究迈向新高度。


主要研究结果

1. WarpDemuX实现高精度、高产率及高速拆分

本研究旨在建立一种稳健、低成本且精准的barcode标记方法,以支持dRNA-seq多重测序及自适应采样实验。本研究将barcode嵌入DNA测序接头(RTA)可定制区域,并直接对原始电信号拆分的策略,从而规避RNA basecalling无法读取DNA接头的技术限制。基于动态时间规整(DTW)算法,构建了适配纳米孔信号特征的机器学习模型,将动态时间规整距离(DTWD)核函数整合至支持向量机(SVM)分类器中,基于DTWD核函数量化未知条形码与已知条形码指纹的相似性,实现reads分类,捕获信号的关键时空信号特征。

image.png

图1 WarpDemuX 模型


通过构建双条形码RNA分子(RTA条形码+内嵌RNA条形码)训练SVM-DTWD模型,基于RNA转录本和 RNA 条形码的碱基识别序列为 RTA 条形码建立真实标签(图1a),同时模型训练引入随机分配策略,评估不同RNA序列背景对分类的影响。与DeePlexiCon(DPC)相比,WarpDemuX在4条形码测试中准确率更高(97% vs. 92%),未分类率更低(7.7% vs. 11.4%),且计算速度快10倍(14.4ms/read vs. 163ms/read)。


表1 DeePlexiCon (DPC) 和 WarpDemuX (WDX) 的性能比较image.png

2. 优化的条形码提升WarpDemuX性能
为突破4种条形码限制,本研究通过构建波浪形的信号模式,结合DNA k-mer模型筛选候选序列,最终选取12个RTA barcode(图2a,b)。优化后的WDX4条形码相比于未优化版本准确率提升2%(99% vs. 97%),产出率提高3.7%(96% vs. 92.3%)。模型扩展至12条形码(WDX12)后,模型准确率仅下降1%,置信度阈值0.5时,未分类率8.8%(表1)。WDX12 模型在所有置信度阈值下,在准确率、产出率和运行时间方面均优于 DPC(4条形码)(图 2e,表 1)。此外,随着条形码数量增加,准确率缓慢下降,但仍维持96%准确率(未分类率14%)(图2f)。
image.png
图2 优化的条形码提高了 WarpDemuX 的性能

3. 单张芯片快速表征SARS-CoV-2病毒表型
基于WarpDemuX多重测序技术,本研究在单张MinION芯片上实现了SARS-CoV-2病毒株的快速表型分析。使用SARS-CoV-2野生株(Wuhan-Hu-1)与ORF8a-GFP突变株感染细胞,采集感染后8-72小时的细胞RNA及72小时病毒上清RNA(图3a),并使用WDX12标记样本进行测序,成功拆分了95.4%的reads,识别了346,691条高质量reads (qscore≥10),设置严格置信度阈值(0.99),保留236,952条有效数据。
image.png
图3 用 WarpDemuX 分析 SARS-CoV-2 感染动力学分析

随着感染进程的推进,观察到reads分布存在明显差异(图3b)。病毒RNA在感染后24h首次检出,48h达峰值(占poly-A RNA的50%),72h降至30%(图3c)。同时亚基因组RNA(sgRNA)丰度存在显著差异,其中sgRNA N在感染后48h占比最高(22.3%),sgRNA 10最低(0.25%)。然而各sgRNA的比例在感染周期内保持稳定(图3d),野生株与突变株复制动力学无差异,表明EGFP插入不影响病毒复制。


通过Poly(A)长度分析显示,在感染后48h,宿主Vero细胞mRNA Poly(A)尾长分布广泛(中位数70 nt,14-227 nt),而病毒RNA尾长显著较短(中位数56 nt,23-108 nt,p<0.001)。感染后72h,细胞中短Poly(A)尾的RNA群体(中位数29 nt)比例增至15%,但病毒颗粒RNA尾长维持不变(图3e-g),推测宿主mRNA降解可能与细胞死亡相关,而病毒基因组由于膜泡的保护可以维持完整性。



4. 自适应采样实现条形码平衡与低丰度样本富集

基于纳米孔测序的自适应采样技术,结合WarpDemuX实现实时信号分析,可以突破传统碱基识别方法的延迟瓶颈(图4a)。传统方法因信号批量处理导致决策滞后,影响孔道寿命与测序产量。研究通过修改 MinKNOW 软件,在 RNA 分子的 Poly (A) 尾仍在孔内时做出拒绝决策。在SARS-CoV-2细胞与上清RNA严重失衡的样本中(图4b),该技术使低丰度条形码富集度提升33-73%,基尼系数从0.44降至0.15(图4f)。同时通过实时剔除高丰度样本,孔道周转率提高,单芯片内可以实现样本均衡覆盖,显著提升了低表达病毒RNA检测灵敏度。

image.png
图 4 使用 WarpDemuX 实现条形码平衡

5. 适配RNA004体系保持高性能
针对纳米孔SQK-RNA004新化学试剂,WarpDemuX通过模型重训练实现高效适配和优化,WDX4–WDX12 模型均保持高准确率(98–99.5%)。通过置信度评分校准系统,用户可自定义准确率等级,实测与预期误差<1%。ROC曲线下面积>0.99(图5a-f),处理速度提升10倍,10万条reads拆分仅需2.2-3.5分钟(图5g)。
表 2 WarpDemuX 在 SQK-RNA004 上两个不同测试集的性能
image.png

image.png
图5 WarpDemuX在SQK-RNA004体系中的性能评估

结论

WarpDemuX突破了dRNA-seq多重测序技术瓶颈,基于信号分析实现高速拆分,准确率大于98%,并通过自适应采样富集低丰度RNA。该技术为传染病监测、RNA代谢调控及表观转录组学提供了强大工具,未来可通过开发3’→5’ DNA信号模型进一步扩展条形码容量,推动纳米孔测序在精准医学中的广泛应用。


参考文献:

van der Toorn, W., Bohn, P., Liu-Wei, W. et al. Demultiplexing and barcode-specific adaptive sampling for nanopore direct RNA sequencing. Nat Commun 16, 3742 (2025).



Copyright © 2018 武汉贝纳科技有限公司 . All Rights Reserved. 鄂ICP备2021008976号-2