基于Nanopore平台测序的TAIL Iso-seq可以准确量化转录本的Poly(A)尾长度,同时分析可变剪接、融合基因、鉴定新异构体,精确定量转录本表达水平,深度解析Poly(A)尾在基因表达调控中的作用。


-
Q:Tail Iso-seq的取样建议?
Tail Iso-seq细胞总量≥ 1 X 107个起送,全长转录组植物组织送样量须达到至少0.5g,动物取新鲜组织,组织体积要小,尽量长宽高≤0.5cm ,所切组织块的大小可参考绿豆颗粒的大小,送样量须达到至少0.2g。血液样本通常建议送新鲜血样,哺乳动物全血:2.5-5ml;鱼类、禽类、两栖类全血:0.5-1.0ml 及以上。
Total RNA的送样要求:

Q:Tail Iso-seq能测到lncRNA的Poly(A)长度吗?
可以,如果lncRNA有Poly(A)尾,可以通过Tail Iso-seq技术进行Poly(A)尾长度检测。
Q:Tail Iso-seq能检测近远端Poly(A)位点使用吗?
可以通过Tail Iso-seq技术直接分析基因Poly(A)位点的近远端usage情况。
Q:想了解某个基因的Poly(A)长度在组间差异及其与基因表达量的关系,怎么做?
Tail Iso-seq能够检测转录本在各样本中的Poly(A)长度分析,因此可以分析组与组之间Poly(A)长度差异。进一步将Poly(A)长度与转录本的表达量进行关联分析即可以得到Poly(A)长度与转录本表达的调控关系。
-
案例解析 植物全长RNA图谱揭示了Poly(A)长度的组织特异性和进化保守性(Nature Plants,IF=17.352)
Poly(A)尾是真核生物mRNA的标志之一,在调节mRNA代谢和翻译中起重要作用。Poly(A)的长度受到Poly(A)聚合酶和去腺苷化酶的动态调控。然而目前植物mRNA Poly(A)尾信息的资源仍相对匮乏。
该研究选取拟南芥的7种不同组织,以及玉米、水稻、大豆的茎组织。共构建了20个FLEP-seq2文库,使用Nanopore MinlON芯片进行测序,建立了包含拟南芥7个不同组织以及水稻、玉米、大豆茎的带有Poly(A)信息的全长转录组数据库。数据库显示不同物种的Poly(A)长度分布非常相似,但也有一些差异:与拟南芥相比,水稻基有更多的带有极短Poly(A)尾的转录本。但同源基因的Poly(A)尾长在不同物种中相对保守,可能是自然选择的结果。该数据库能够在不同组织和不同物种的单基因水平对植物Poly(A)尾进行全基因组表征研究。

参考文献:
Jia J, et al. An atlas of plant full-length RNA reveals tissue-specific and monocots-dicots conserved regulation of Poly(A) tail length. Nature Plants, 2022
-
大多数真核 mRNA 的 3‘非翻译区域下游含有一个非模板化的 poly(A)尾,这个尾有助于 mRNA 的稳定和向细胞质内的运输。poly(A)尾长度会影响mRNA的翻译效率,因此,poly(A) 尾长度分析可解析 mRNA 降解和翻译的动态调控过程,也能够发现一些 RNA 裂解和加尾的未知特点。使用 Dorado对有效数据的 poly(A) 长度进行计算,获得转录本对应的 poly(A) 长度。

不同样本的 poly(A) 尾长的分布图
将 poly(A) 长度中位数与表达量关联起来,得到 poly(A) 长度与转录本表达量的关联结果。

样品 poly(A) 长度与表达量的分布图
在真核生物中50% ~ 80%的基因有多个poly(A)位点,这些基因通过选择不同poly(A)位点进行多聚腺苷酸化,进而形成多个不同的 mRNA异构体,这个现象称为可变多聚腺苷酸化(alternative poly(A)denylation, APA)。当APA发生在内含子区域或编码区时,不同poly(A)位点的使用可能会导致其编码的蛋白序列发生改变;当APA发生在基因的3’UTR区域,会产生不同3’UTR长度的mRNA异构体,而不同长度的3’UTR会影响RNA结合蛋白(RNA-binding proteins, RBPs)在mRNA 3’UTR区域的结合,进而影响mRNA的功能、稳定性、翻译以及亚细胞定位。
使用 Quantifypoly(A) 进行poly(A)位点的鉴定、聚类与注释。

PAT在基因各个区域分布图
基因的poly(A)位点数量分布如下图所示:

PAC数量分布图
3’UTR 长度变化统计如下图所示:

3’UTR长度变化的统计
3’UTR长度的变化与基因表达之间的关系结果展示如下:

3’UTR长度的变化与基因表达之间的关系
利用表达定量得到的转录本在各个样品中的表达量 reads count 数据,进行差异表达分析。差异表达分析的软件为 DESeq2 ,筛选阈值为 padj < 0.05 且 |log2FoldChange| > 1.0,鉴定的差异表达转录本数目。

差异表达转录本火山图
富集分析统计学方法一般使用超几何检验,找出差异基因/转录本相对于所有有注释的基因/转录本显著富集的 GO Term 或 KEGG Pathway,KEGG富集分析软件为 clusterProfiler,GO富集分析软件为topGO。

差异表达转录本 GO 富集分析 dotplot 图

差异表达转录本 PATHWAY 富集分析 barplot 图