NBT文献解读 | 深度长读长 RNA-seq 揭示老年人额叶皮质中的RNA异构体奥秘
点击蓝字关注我们
英文标题:Mapping medically relevant RNA isoform diversity in the aged human frontal cortex with deep long-read RNA-seq
发表时间:2024.5
发表期刊:Nature Biotechnology
IF:33.1
通讯作者: John D. Fryer & Mark T. W. Ebbert(University of Kentucky, USA)
研究介绍
RNA异构体是由同一基因产生但经过不同剪接过程形成的RNA分子,能够编码多种不同的蛋白质,每种都可能具有独特的生物学功能。传统短读长测序技术在解析这些异构体方面往往存在局限,其倾向于将所有异构体的表达进行合并,而忽略了异构体之间的功能差异。
本文重点关注了大脑前额叶皮层组织中AD患者与健康对照之间的RNA异构体表达的差异,揭示了仅在基因水平无法检测到的疾病相关的转录特征,强调了通过深度长读长RNA测序进行RNA异构体定量的重要性。长读长测序不仅可以发现新的异构体,还有助于理解它们在特定疾病如阿尔茨海默病中的表达变化,以及这些变化如何指示疾病状态,为深入理解RNA异构体在人类健康与疾病中的作用奠定了坚实的科学基础。
主要研究结果
1.方法与结果的概述
该研究采用长读长测序技术,对6名阿尔茨海默病患者与6名健康对照者的前额叶皮层样本,基于Nanopore PromethION平台每个样品各测一个cell,并使用bambu软件定量鉴定到大量RNA异构体(图1b)。通过设定严格的过滤标准,共识别出来自18,041个基因的28,989个表达的RNA异构体。
图1 研究设计与理论依据
2.从已知基因中发现新的RNA异构体
使用bambu软件鉴定出已知基因的1534个新异构体,其中428个CPM>1,可以被认为是高置信度的异构体(图2a,b)。相比之前的研究,本研究鉴定的新异构体数量较少,可能的原因包括:使用的参考数据库不同,分析软件不同,测序深度不同以及更严格的异构体定义标准。与已有参考基因组相比,有297个新异构体(69.4%)是特有的。通过随机抽取reads比较测序深度对新异构体鉴定的影响,发现采用20%的比对reads仅鉴定到490个已知基因的新异构体,而使用100%的比对reads则鉴定到1534个新异构体。
图2 在人类前额叶皮质组织中表达的已知基因的新RNA异构体
这些鉴定到的已知基因的428个高置信度的新异构体,长度中位数为761.5nt,长度分布在179 nt~3,089 nt之间(图2c),外显子数介于2到14之间(图2d)。这428个新异构体中包含了737个新的外显子-内含子边界,其中94.9%含有5′剪接位点,100%含有3′剪接位点(图2f)。
作者通过PCR和凝胶电泳验证了17个异构体中的9个新异构体(图2g),并利用GTEx和ROSMAP等公共数据库确认了这些新异构体的存在。同时还基于新的T2T CHM13参考基因组数据验证了其他新的异构体,并在蛋白质水平上验证了11个新异构体(图2h,i)。
3.具有医学意义的基因
在428个新异构体中,有53个源自49个具有医学意义的基因(图3a)。其中,reads比例最高的基因包括SLC26A1(与肾结石和骨骼肌问题相关)、CAMKMT(涉及多种疾病如低张力胱氨酸尿症)和WDR4(与小头症和Galloway-Mowat综合征相关)。还鉴定到一个未记录的TREM2变体(与阿尔茨海默病风险相关),此变体在二号外显子上发生跳跃(图3b)。此外,与DNA修复过程相关的POLB基因的新变体也占据了该基因活性的28%(图3d)。
图3 在人类额叶皮质中表达的新RNA异构体和新的剪接、线粒体编码的医学相关基因的RNA异构体
4.剪接的线粒体编码RNA异构体
该研究新发现一组罕见的线粒体基因异构体,这些异构体含有两个外显子,与常规认知中线粒体基因仅有一个外显子的情况大相径庭(图3e)。鉴于线粒体RNA的特殊性,作者使用全长reads计数而非中位表达量来筛选这些新异构体,最终确认了5个高可信度的线粒体异构体,包括MT-RNR2基因,该基因对于线粒体功能及细胞存活至关重要(如编码具有抗细胞死亡功能的人素肽)。尽管这些新异构体的表达水平低于典型线粒体基因,但与其他核基因的异构体相比,表达量偏高(图3f-g)。
值得注意的是,这些新异构体的剪接位点表现出典型的剪接信号特征。作者通过实验验证了其中2个异构体,并使用其他数据集进一步确认了所有5个异构体。线粒体在多种人类疾病中发挥着核心作用,如癫痫、共济失调、神经退行性疾病及老化相关疾病,尽管这些新异构体的具体功能尚不明朗,但是它们潜在的生物学意义和作为线粒体功能的生物标志物的价值不容忽视。
5.从新基因中发现新的RNA异构体
该研究使用Bambu软件从1,676个新预测的基因中鉴定到1,860个异构体。筛选CPM>1,鉴定到267个来自245个基因的高置信度异构体,这些异构体表现出典型的剪接信号特征,大部分含有两个外显子,且长度多样,表明可能存在较大的RNA分子未被完全测序(图4a-d)。
图4 在人类额叶皮质组织中新基因的异构体
这些新基因的异构体中,有相当一部分与已知基因重叠或嵌合,部分可能源于基因内非特异性转录和剪接过程,这一现象可能与细胞衰老相关(图4e-f)。其中,82.5%的外显子包含典型5′剪接位点motif的“GT”核苷酸,而90.7%包含典型3′剪接位点motif的“AG”核苷酸(图4f)。有趣的是,鉴定到一个新基因(BambuGene290099)拥有3个高置信度的RNA异构体(图4g)。作者通过PCR实验方法验证了12个新异构体,同时还在蛋白质水平上确认了3个新异构体的表达,表明它们可能具有一定的功能(图4g-i)。此外还鉴定出一种新的低丰度RNA异构体(CPM < 1),包含两个ERCC RNA spike-ins外显子,也通过PCR实验得到了验证。
6.表达多个RNA异构体的医学相关基因
该研究鉴定到7,042个基因能产生两种或以上CPM > 1的RNA异构体,其中3,387个基因能够生成多于2个具有不同蛋白质序列的异构体(图5a-b)。尤其在与医学相关的5,035个基因中,有1,917个表现出多异构体现象,1,018个表达不同的编码蛋白序列,突显单一组织中医学相关基因的异构体多样性及在特定组织背景下理解遗传变异的重要性(图5c)。
图5 在额叶皮层表达多个RNA异构体的基因
值得注意的是,与脑部疾病相关的98个基因在前额叶皮质中表达了多种RNA异构体,比如阿尔茨海默病相关的APP基因 (Aβ-前体蛋白) 有5种异构体, MAPT基因(tau蛋白)有4种,而BIN1基因则有8种(图5d-h)。该研究仅检测到4种CPM>1的MAPT异构体,其中两种表达显著高于其他异构体,与此前报道的中枢神经系统中有6种异构体有所差别。此外,与神经退行性疾病和精神疾病相关的基因,如SOD1、SNCA、TARDBP和SHANK3,在前额叶皮质中也表达了多种异构体(图5i-l)。
7.RNA异构体分析揭示基因层面隐藏的表达模式
长读长RNA测序技术的一大优势在于能够进行差异RNA异构体表达分析,这对于揭示特定细胞和组织中活性异构体及其与人类健康和疾病关联至关重要。该研究对6例阿尔茨海默病(AD)患者与6例认知正常的对照者进行了差异基因和差异异构体表达分析。鉴定到176个差异表达基因和105个差异表达的RNA异构体,其中有99个异构体在其基因层面并无显著差异(图6a,b)。有趣的是,TNFSF12基因产生的两种异构体表达趋势相反:TNFSF12-219异构体在AD病例中上调,而TNFSF12-203在对照组中上调,但其基因水平却无显著差异(图6c-e)。
图6 RNA异构体分析能够揭示在基因水平上无法获得的疾病表达模式
总结
该研究证实了在人类前额叶中存在大量医学相关的基因表达了多种RNA异构体。这些异构体编码了不同的蛋白质序列,表明它们可能承担着多样化的生物学功能。同时通过差异RNA异构体分析可以揭示在阿尔茨海默病中那些在基因水平上无法捕捉的转录组特征。该研究表明,采用长读长RNA-seq技术可以分析复杂人类疾病中的RNA表达模式,对于识别潜在的治疗和诊断分子靶标具有显著的优势和潜力。
参考文献:
Aguzzoli Heberle, B., Brandon, J.A., Page, M.L. et al. Mapping medically relevant RNA isoform diversity in the aged human frontal cortex with deep long-read RNA-seq. Nat Biotechnol (2024).
https://doi.org/10.1038/s41587-024-02245-9
点击文末阅读原文,获取文献链接