干货指南|Direct RNA测序m6A修饰结果一本通:结果解析,数据分析挖掘,实验验证
RNA存在超过100种修饰,最常见的包括甲基化、羟甲基化、乙酰化等。其中,m6A(N6-methyladenosine,N6-腺苷酸甲基化)是RNA上最丰富的一种甲基化修饰,平均每条转录本有1~3个m6A修饰。m6A存在于大多数真核生物(包括哺乳动物、昆虫、植物和酵母)和一些病毒的mRNA中,也存在于tRNA、rRNA、小核RNA以及一些长链非编码RNA中。RNA甲基化在调控基因表达、剪接、RNA编辑、RNA稳定性、控制mRNA寿命和降解等方面可能扮演重要角色。与传统技术不同,纳米孔Direct RNA测序(DRS)可以对天然RNA分子进行测序,无需扩增或逆转录,可以在读取RNA碱基序列的同时获得碱基修饰信息。
RNA修饰类型
使用Nanopore官方的basecall软件Dorado(版本:0.8.0)可以精准检测和识别DRS数据中的多种类型的修饰位点,其最新模型在单碱基水平上识别m6A的准确率可达97.1%。目前DRS m6A修饰分析的内容主要包括m6A的位点鉴定、位点分布、motif分析、区域注释以及m6A修饰差异分析。以下是对DRS m6A修饰分析结果的简要解读,以及提供一些m6A修饰的分析挖掘及验证思路。
(一)
主要结果解读
1. m6A位点鉴定
表1:m6A位点鉴定结果
m6A位点鉴定时会针对每条read计算一个统计量,根据该统计量对该位点的read 进行甲基化位点状态的判定。统计甲基化reads数(n(M))和未甲基化的reads数(n(UM)),根据公式Fraction = n(M) / (n(UM) + N(M) ),计算出位点的打分值(Fraction)。
m6A位点鉴定结果中第一列(Trans)为比对到参考序列上的转录本,第二列(Pos)为甲基化位点;第三列(Gene)为该转录本对应的基因;第四列(Fraction)为该甲基化位点的打分值;第五列(Chr)为该甲基化位点的染色体信息;最后一列(Motif)为该甲基化位点附近5bp的motif序列。
2. m6A位点分布
染色体不同区域往往拥有着不同的功能,其中特定区域在基因转录表达中起到非常重要的作用。当这些区域发生甲基化时,可能对该区域的转录表达产生一定的影响。将m6A位点对应到参考基因组上,提取出相应的位点信息进行绘图,按照窗口50 kb统计发生甲基化的位点数,并进行可视化。颜色的深浅可以反映该区域m6A甲基化位点的密度。
图1:m6A位点分布
3. m6A motif分析
RNA甲基化修饰以及去甲基化修饰起始于多种结合蛋白与发生甲基化位点的 motif 相结合。motif本质上是一种具有生物意义的核酸序列模式,RNA甲基化相关酶可识别这些motif并与之结合,从而影响基因的表达。因此鉴定这些motif,对于基因表达调控机制研究具有重要意义。我们在发生m6A甲基化的位点上下游分别扩展2个碱基,得到由5个碱基组成的motif。其中横坐标为碱基的相对位置,3为甲基化位点,每个位置的总高度为该位置碱基的序列保守性,而碱基信号的高度代表该碱基在该位置上的相对频率。
图2:m6A motif分析
4. m6A区域注释
在对m6A位点整体分布统计的同时,也会基于参考序列的位置注释信息来对m6A不同区域的分布进行统计绘图。
图3:m6A位点注释到各个基因功能区域的数目统计
图4:m6A位点在各个基因功能区域的密度分布,横坐标为基因结构,纵坐标为m6A的密度
5. m6A修饰差异分析
表2:m6A修饰差异分析结果
使用methylkit软件可以进行差异甲基化位点(Differential methylation loci,DML)分析。当每组有多个样本时,采用 Logistic 回归检验;当每组仅有一个样本时,使用 Fisher 精确检验进行差异甲基化的检测。默认情况下,差异水平设置为10,pvalue值设定为0.05,使用SLIM(sliding linear model)方法矫正pvalue值,也就是默认差异筛选阈值为 | meth.diff | >= 10 且 pvalue < 0.05。
m6A修饰差异分析结果中,第一列(Trans_ID)为转录本ID,第二列(Gene_ID)为基因ID,第三列(Gene_Name)为基因名称,第四列(pvalue)为p值,第五列(qvalue)为q值,第六列(meth.diff)为差异程度,第七列(Direction)为差异方向,其中,No significant difference是差异不显著,Up是实验组相对于对照组甲基化程度显著较高,Down是实验组相对于对照组甲基化程度显著较低。
(二)
m6A修饰分析挖掘思路
1. 修饰有无及差异分析
m6A修饰作为真核细胞中最为常见的修饰,在不改变碱基序列的前提下,可以对RNA的转录、剪接、翻译等过程起到调控作用,因此可以从m6A修饰的有无以及差异出发挖掘生物学意义,例如Xu等[1]发现缺失FIO1导致拟南芥整体m6A甲基化水平下降,并呈现出早花表型,通过DRS测序分析比较FIO1突变体和野生型之间差异化的m6A修饰,结果显示FIO1具有独特的m6A甲基转移酶功能,优先在转录本CDS序列中建立m6A修饰,并且其可以介导催化m6A甲基化发生。
图5:m6A修饰差异[1]
2. 多种修饰关联分析
其次,m6A或m5C等多种修饰的关联分析也是一个切入点,多种修饰之间可能产生复杂的相互作用,进而影响RNA的稳定、定位、降解或翻译。例如Yu等[2]基于Nanopore平台对水稻6个不同组织进行DRS测序,并对含有m6A和m5C修饰的转录本进行比较发现,m6A和m5C均表现出组织特异性的修饰模式。被m6A修饰的转录本也倾向于被m5C修饰,其中含有m5C修饰的转录本中有超过75%的转录本同时含有m6A修饰。
图6:m6A与m5C关联分析[2]
3. 修饰与表达关联分析
此外,m6A修饰还可以与基因表达关联,能够从表达水平解析修饰对基因表达的调控机制。例如Jiang等[3]构建人源化肝脏小鼠模型,对小鼠进行禁食和干预后进行DRS测序,通过差异修饰分析,鉴定到302个差异显著的修饰位点,且有超过三分之一含有GGACA motif,其中超过40%具有转录本或基因表达水平的变化,表明RNA上的m6A修饰可以调控其表达水平。
图7:m6A与表达量关联分析[3]
4. 修饰与可变剪切关联分析
已有研究发现m6A修饰可以参与可变剪切调控,关键甲基转移酶的存在或者缺失可能影响多个基因的剪切模式和类型。例如Shen等[4]通过DRS测序结合Illumina短读长测序,全面分析了秀丽隐杆线虫中m6A甲基转移酶METTL10缺失对RNA剪切的影响。研究发现,METTL10的缺失导致大量基因剪切位点的选择发生改变,尤其是对于5'剪切位点表现出高度敏感性,并且与部分剪切因子在调节5'剪切位点方面存在显著的协同作用。
图8:修饰与可变剪切关联分析[4]
5. 修饰与Poly(A)关联分析
Poly(A)尾巴与m6A修饰均可参与mRNA的稳定与翻译,因此探究Poly(A)与m6A的内在相互作用关系也具有重要意义。例如Zhang等[5]借助DRS测序构建了六种被子植物的Poly(A)尾巴长度和m6A修饰图谱,结果显示基因表达与Poly(A)尾巴长度和m6A修饰程度呈现负相关,而Poly(A)尾巴长度和m6A修饰呈现正相关。并且该趋势在六个物种中均一致,推测基因表达、Poly(A)尾巴长度和m6A修饰的相互关联在被子植物中较为保守。
图9:修饰与Poly(A)关联分析[5]
(三)
m6A修饰验证思路
比较常见的验证方法主要是斑点杂交、质谱检测、SELECT试剂盒检测以及MeRIP-qPCR或者MeRIP-Seq。
1. 斑点杂交
首先是斑点杂交。斑点杂交(Dot blot)可检测和鉴定 DNA、RNA 和蛋白质,通过显影斑点的有无及颜色的深浅来判断是否有杂交及其杂交强度。在研究 RNA 修饰时经常用到斑点杂交来对细胞内总RNA的修饰水平进行定性或半定量分析。具体步骤是指将待测的 RNA 变性后点加在硝酸纤维素膜或 NC 膜上,紫外交联固定后用m6A或者m5C抗体进行杂交,洗膜,放射自显影,以斑点有无或颜色的深浅代表RNA修饰水平的高低。
图10:斑点杂交验证[6]
2. 质谱检测
其次也可以通过质谱检测(HPLC/LC-MS)验证m6A修饰。HPLC采用串联质谱的方式,通过结合酶处理和离子打碎,将核酸打断成核苷和碱基,根据出峰保留时间和峰面积,计算m6A和总腺嘌呤的比例,得到mRNA的m6A整体的甲基化程度。然而,此种方法无法明确发生修饰的RNA以及修饰的具体位置。
图11:质谱检测(HPLC)验证[7]
3. SELECT试剂盒检测
基于SELECT检测技术的试剂盒,可以对低丰度转录本实现单碱基分辨率m6A修饰检测,无需抗体富集就能够针对性地对特定的m6A修饰位点进行定量,分析样本间m6A修饰丰度的差异,并鉴定目标位点是否存在m6A修饰。其原理在于m6A修饰会阻碍DNA聚合酶在反转录过程的单碱基延伸,同时也会降低缺口连接酶的连接效率。因此,SELECT检测技术无需抗体IP和同位素标记,通过荧光定量PCR,即可实现单碱基分辨率m6A修饰的精确定量。
图12:质谱检测(HPLC)验证[8]
4. MeRIP-qPCR或MeRIP-Seq
最为常见也较为普遍使用的方法则是MeRIP-qPCR或者MeRIP-Seq。MeRIP-qPCR用于对目标基因上的某个修饰区域(以一小段区域的形式,MeRIP法精确不到单碱基)的修饰水平进行验证。其原理同MeRIP-seq测序中MeRIP实验相同,实验基本操作也一致:对RNA进行片段化,然后将片段化后的RNA样品分为二部分:一部分用于免疫共沉淀实验(IP)后作为IP样品,另一部分不进行IP直接作为Input样品。之后再根据实验目的的不同,对两部分RNA片段进行逆转录和qPCR。MeRIP-Seq则是捕获mRNA和片段化后,通过特定修饰抗体富集含有修饰的RNA片段,对这一部分RNA进行peak分析得到修饰位点。
图13:MeRIP-qPCR验证[9]
参考文献:
[1] Xu T, Wu X, Wong C E, et al. FIONA1‐mediated m6A modification regulates the floral transition in Arabidopsis[J]. Advanced Science, 2022, 9(6): 2103628.
[2] Yu F, Qi H, Gao L, et al. Identifying RNA modifications by direct RNA sequencing reveals complexity of epitranscriptomic dynamics in rice[J]. Genomics, Proteomics & Bioinformatics, 2023, 21(4): 788-804.
[3] Jiang C, Li P, Ma Y, et al. Comprehensive gene profiling of the metabolic landscape of humanized livers in mice[J]. Journal of Hepatology, 2024, 80(4): 622-633.
[4] Shen A, Hencel K, Parker M T, et al. U6 snRNA m6A modification is required for accurate and efficient splicing of C. elegans and human pre-mRNAs [J]. Nucleic Acids Research, 2024: gkae447.
[5] Zhang J, Wu L, Mu L, et al. Evolution and post‐transcriptional regulation insights of m6A writers, erasers, and readers in plant epitranscriptome [J]. The Plant Journal, 2024.
[6] Sun B, Bhati K K, Song P, et al. FIONA1-mediated methylation of the 3’UTR of FLC affects FLC transcript levels and flowering in Arabidopsis[J]. PLoS Genetics, 2022, 18(9): e1010386.
[7] Liu C, Sun H, Yi Y, et al. Absolute quantification of single-base m6A methylation in the mammalian transcriptome using GLORI[J]. Nature Biotechnology, 2023, 41(3): 355-366.
[8] Xiao Y, Wang Y, Tang Q, et al. An elongation‐and ligation‐based qPCR amplification method for the radiolabeling‐free detection of locus‐specific N6‐methyladenosine modification[J]. Angewandte Chemie International Edition, 2018, 57(49): 15995-16000.
[9] Price A M, Hayer K E, McIntyre A B R, et al. Direct RNA sequencing reveals m6A modifications on adenovirus RNA are necessary for efficient splicing[J]. Nature Communications, 2020, 11(1): 6016.