• Direct RNA 测序

    Direct RNA测序是基于Nanopore测序平台, 不经反转录、无须扩增,直接读取全长转录本, 无测序偏好性, 检测RNA分子甲基化(m6A和5mC)等修饰位点; 准确分析可变剪接、融合基因和鉴定新异构体; 此外,还可对poly(A)尾长度进行相对准确的估算,还原真实RNA特征。

    图1 总流程示意图(Daniel et al., 2019)

  • 产品优势

    检测碱基修饰

    无需扩增或逆转录,纳米孔测序可直接鉴定核苷酸序列旁的碱基修饰,无需改变化学或实验方案。

    PolyA 尾预测

    纳米孔测序可以对不同polyA剪接位点类型(经典的、可变的及无剪接位点)的polyA尾进行长度统计。

  • 功能注释

    全面的功能注释和分类

    UniProt

    功能注释

    Swiss-Prot含55万条手工注释的蛋白序列;TrEMBL作为其补充,含6500万条机器注释的序列。

    EggNOG

    基因家族

    EggNOG是一个orthologous groups数据库。可以按照基因家族对基因进行分类。

    Gene Ontology

    功能分类

    Gene Ontology分类是基因功能国际标准分类体系。从细胞组分、分子功能和 生物过程三个方面描述基因功能。

    Pathway

    生物通路

    KEGG Pathway收集了大量手工绘制的Pathway, 是目前最主流的Pathway数据库。

  • 差异表达

    不限次调整软件及参数

    DESeq2/edgeR

    合适的差异软件

    不同项目设计,尤其是生物学重复数目的设计,需要采用不同的差异分析软件。我们会为您选择最合适的软件进行分析。

    logFC/FDR

    灵活调整

    通常采用logFC、FDR两个参数来筛选差异表达基因,我们会根据项目设计和您的要求,不断调整参数,直到您满意。

    GO/Pathway/?

    富集分析

    除了GO和Pathway的富集分析,我们还可以根据您自己构建的分类进行富集分析。

  • 常见问题

    1、Direct RNA 测序只能用Nanopore测序平台完成吗?

    是的,目前只有Nanopore能直接读取RNA序列,其他所有测序平台读取的都是cDNA 的序列。

     

    2、Direct RNA测序能检测哪些修饰?

    理论上可以检测所有修饰位点,目前主要是分析m6A和m5C。

     

    3、Direct RNA测序能检测同源基因的修饰位点吗?

    是的,Direct RNA测序可以检测同源基因,同时检测RNA修饰,因此可以检测同源基因的RNA修饰位点。

     

    4、Direct RNA测序必须一个样品一张芯片吗?

    是的,Direct RNA测序不支持加barcode,一张芯片对一个样品进行测序。

     

    5、Direct RNA测序一张芯片可以产生多少数据?

    Direct RNA测序一张芯片的平均是5Gb,不同的物种和不同组织样品差异较大,有的样品可以产生2-3Gb数据,有的样品可以产生10Gb甚至更多数据。由于RNA通过纳米孔比较DNA通过纳米孔的速率低很多,因此单张芯片的数据产出比DNA测序少很多。

     

    6、Direct RNA测序需要的样品量是多大,为什么?

    RNA总量≥50ug,Direct RNA测序是直接对RNA进行测序,不经过PCR等步骤,因此样品的起始量较大。

     

    7、Direct RNA测序适合什么物种?

    理论上适合所有物种,不过不建议对没有参考基因组的物种进行Direct RNA测序。

     

    8、Direct RNA测序是否可以检测PolyA的长度,是否准确?

    Direct RNA测序可以检测PolyA长度,相对准确。

  • 参考案例

    人 poly(A) 转录组的 Nanopore Direct RNA测序
     

    文献名称:Nanopore native RNA sequencing of a human poly(A) transcriptome

    发表期刊:Nature Methods

    发表时间:2019年11月

    影响因子:28.467

     

    研究材料

    分别来自英国哥伦比亚大学、加拿大安大略癌症研究所、美国约翰霍普金斯大学、美国加州大学圣克鲁兹分校、英国诺丁汉大学、英国伯明翰大学的6个人B淋巴细胞系(GM12878)。

     

    研究思路

    从人B淋巴细胞系GM12878中分离RNA,进行Direct RNA测序,同时取相同的样品进行cDNA测序,应用MinION平台对每个研究机构的样品各测5张芯片,一共测30张芯片。获得的结果用于下游分析:isoform分析,等位基因分析,poly(A)尾长度分析,碱基修饰分析等。

     

    主要结果

     

    Direct RNA数据统计

    一共测序30张芯片,获得13M条reads,过滤后得到10.3M条reads。每张芯片过滤后的reads N50为1,334bp,中位数为771bp。比对到GRCh38人基因组上的reads数超过9,900,000条。

    Nanopore Direct RNA测序数据中位数一致性为86±0.86%。错配、插入和缺失分别为2.4%、4.3%和4.4%。G-for-C和C-for-G的错误率分别为0.38%和0.47%;C-to-U和U-to-C的错误率分别为3.62%和2.23%。将得到的reads长度与GENCODE v27中已知转录本长度进行比较,结果基本一致。

     

    线粒体RNA评估纳米孔的测序性能

    线粒体 RNA 因其含量丰富,单外显子,长度差异大(349-2379 nt)的特性,可被用于评估纳米孔的测序性能,结果表明,约10%的reads与线粒体基因组一致。

    线粒体RNA(MT-RNA) reads 长度分析显示,比对到MT-CO2和MT-ND4L/MT-ND4上的优势reads长度与预期相符。

     
  • isoform 检测和分析

    Nanopore 长读长可以提高RNA外显子与外显子连接区域的分辨率,从而挖掘未注释的isoform。应用Nanopore Direct RNA测序,结合FLAIR工具,鉴定到10793个基因,这些基因一共注释到33984个isoform,52.6%未注释到剪切位点 (占总reads的13.0%)(图a)。研究发现非编码基因的剪切类型比编码基因更为复杂(图b),这与之前的研究结果一致。

     

    等位基因鉴定

    长读长Nanopore RNA reads更容易鉴定等位基因,因为遇到杂合SNP的几率更大。本研究发现了3751个基因,其中3707个来自常染色体,44个来自X染色体。且23个特异的X-连锁基因中有22个来自于母系等位基因,唯一的父系表达的X-连锁基因,编码长链非编码RNA XIST,可以调控女性的X失活。

    同时,鉴定到5个isoform来自不同亲本的基因。例如IFIH1基因中,来自父本isoform保留了外显子8,而来自母本的isoform不保留(图d)。该转录本在等位基因分配中,最近的SNV距离可变剪接事件长达886 nt,而用短读长测序无法检测到的。

    3′ poly(A) 分析

    poly(A)尾在转录后调控中发挥重要作用,包括mRNA稳定性和翻译有效性。这些均聚物长达数百个核苷酸,所以短读长测序数据很难检测到。本研究使用与3' poly (A)相关的低方差电流信号,利用nanopolish-polya算法,通过校正RNA分子通过纳米孔的速度,估算poly (A)尾长度。

     

    结果显示,线粒体poly(A)的长度分布集中在~50 nt,不超过100 nt,转录本poly(A)平均长度为52 nt。这与其他人细胞系的线粒体poly(A) RNA结果一致。而核转录本的长度分布更加广泛,峰值为58 nt,平均值为112 nt,大量poly(A) 尾大于200 nt。

     

    该方法还发现了同一个基因的不同isoform之间poly(A)尾的区别。例如DDX5的两个isoform,一个是内含子保留型,poly(A)尾中位数长度为327nt,另外一个是编码蛋白型,poly(A)尾中位数长度为125 nt(图c)。

     

    作者继续探索poly(A)尾长度与内含子保留之间的关系,结果表明,内含子保留型转录本的ploy(A)尾比不含内含子的转录本长(中位数分别为232nt 和91nt)(图d)。

    修饰检测

    Nanopore测序可以鉴定DNA 和RNA的碱基修饰。m6A是最常见的一种mRNA内部修饰,与RNA代谢的许多方面相关。m6A失调被发现与肥胖症和癌症等人疾病相关。

     

    本研究重点关注m6A甲基转移酶复合物的一个亚基—甲基转移酶3的GGACU结合序列,图6a将EEF2中假定的m6A位点的原始电流信号与体外转录复制的信号进行对比,发现m6A导致了电流信号的改变。为了验证这个结果,通过合成寡聚物(图b)进行比较,同样检测到明显的电流差(图c)。

     

    对同一个基因的不同isoform之间 m6A修饰分析,结果显示86个基因(198个isoform)的电流水平在isoform之间存在显著差异。例如SNHG8基因(图d)。

  • 参考文献

    Workman R E, Tang A D, Tang P S, et al. Nanopore native RNA sequencing of a human poly (A) transcriptome[J]. Nature methods, 2019: 1-9.

所有文章
×