重磅综述:被人忽略的poly(A)尾,如何成为表观遗传调控的重要角色
表观遗传学最初指的是那些不能仅通过经典遗传学原理来解释的现象,随着对基因表达调控研究的深入,其定义也扩展至DNA甲基化或组蛋白修饰等能在相同DNA序列背景下维持不同基因活性状态的分子和机制。近年来,RNA作为表观遗传信息的载体也逐渐受到了广泛关注,因为RNA可以通过影响基因的表达或者修饰来调控细胞或机体的功能,进而驱动多样化的生物学进程。
poly(A)尾是mRNA的重要结构组成部分,对mRNA的稳定性和翻译至关重要,而我们往往忽略了poly(A)的表观遗传调控机制。随着测序技术的发展,使得我们能够对转录组范围内poly(A)尾的长度和组成进行全面的分析,进而发现poly(A)能够编码丰富的调控信息,发挥着与RNA化学修饰相似的作用。
近日,来自中国科学院遗传与发育生物学研究所分子发育生物学国家重点实验室的陆发隆研究团队在《Trends in Biochemical Sciences》期刊上发表了题为“Beyond simple tails: poly(A) tail-mediated RNA epigenetic regulation”的综述,系统综述了目前关于RNA poly(A)尾的组成及其动态调控的研究进展,详细阐明了poly(A)在RNA表观遗传调控方面多层次的作用与机制,为深入理解mRNA稳定性和翻译效率的调控机制提供了新的视角。
01
poly(A)尾是什么?
一般而言,poly(A)尾被认为是mRNA末端的一段腺苷酸长链,其在大多数真核mRNA中普遍存在。在酵母中,poly(A)尾的长度约为70~80 nt,而在哺乳动物细胞中则为200~250 nt。作为mRNA的重要结构组成部分,poly(A)尾通过参与mRNA稳定、翻译以及胞质运输等过程,深入影响和调控mRNA的生命周期。此外,不仅限于mRNA,许多长非编码RNA(lncRNA)也存在poly(A)尾,同样也可以促进lncRNA的核输出和稳定性。
02
poly(A)尾是如何加上的?
在哺乳动物中,前体mRNA加上poly(A)尾主要涉及两个步骤:首先是多聚腺苷酸化特异性因子(CPSF)复合体参与切割,其次是poly(A)聚合酶(PAP)进行多聚腺苷酸化。这一过程大致如下:1)在细胞核中,CPSF复合体识别并结合位于前体mRNA的3’端附近的多聚腺苷酸化信号(PAS)。2)随后在PAP的作用下poly(A)尾与核多聚腺苷酸结合蛋白(PABPN)结合,形成成熟的mRNA。3)成熟的mRNA随后被运输至细胞质中。在细胞质中,poly(A)尾经历PAN2-PAN3和CCR4-NOT复合体的修剪,进一步与胞质多聚腺苷酸结合蛋白(PABPC)结合,使得mRNA能够被80s核糖体翻译。
此外,poly(A)尾不仅在细胞核中可以通过与转录耦合进行多聚腺苷酸化,还可以在细胞质中受到末端核酸转移酶(TENT)调控,进而实现尾巴的延伸或修饰。这一加尾的过程表明poly(A)尾巴在mRNA加工和功能调节中的核心作用以及poly(A)尾巴长度调控的复杂性,这对于转录后修饰和mRNA代谢起着关键作用。
图1:mRNA poly(A)尾代谢概览
03
如何对poly(A)尾进行测序呢?
NGS技术已经可以从单细胞水平进行RNA测序,然而由于poly(A)尾的同源多聚特性,常规的转录组测序难以实现对poly(A)尾的测序,因此在建库测序或者数据分析阶段,通常会丢弃poly(A)尾信息。为了在转录组层面上实现对poly(A)尾巴进行测序和分析,目前已有多种基于二代测序开发的测序和分析方法,比如TAIL-seq、mTAIL-seq、PAL-seq等,均能实现较为准确地检测poly(A)尾。其中,PAL-seq基于荧光定量方法,使用与生物素偶联的dUTP检测poly(A)位点掺入的U碱基相对量,从而测定poly(A)尾巴的长度;而TAIL-seq、mTAIL-seq则利用特定的碱基识别算法解析测序原始数据,实现对A碱基数目的量化。
以Nanopore和Pacbio为代表的第三代测序技术,由于对同源多聚序列不敏感,使得可以进行精确的poly(A)尾测序。例如,基于PacBio的HiFi模式开发的PAIso-seq、FLAM-seq、FLEP-seq和FLEP-seq2等方法通过对单一分子进行反复测序得到一致性序列,从而准确测量poly(A)尾,并且反复测序的准确性有助于检测poly(A)尾巴内部的非A残基,也突显了poly(A)尾长链的复杂性。
Nanopore平台的优势在于其不仅可以直接对mRNA分子进行测序(Direct RNA Sequencing,DRS),也可以对包含完整poly(A)序列的cDNA进行测序,比如FLEP-seq、FLEP-seq2和Nano3P-seq。无论是通过cDNA测序还是直接RNA测序,Nanopore测序均能揭示poly(A)尾巴内的非A残基。与依赖反转录的方法不同,直接RNA测序可以对真实地RNA进行测序,并基于机器学习等方法,实现对RNA化学修饰的检测,从而为探究poly(A)尾长度、可变多聚腺苷酸化(APA)、可变剪接以及可能的RNA化学修饰之间地相互作用提供了可能性。
图2:poly(A)尾测序方法
04
poly(A)尾的长度是如何参与基因表达调控的呢?
借助先进的测序技术,我们得以研究poly(A)尾的长度是如何参与基因表达调控。poly(A)尾影响着mRNA的稳定性和翻译效率,其长度的动态变化可以激活或者抑制特定基因的表达,从而实现对基因的调控作用。调控机制主要包括脱尾(脱腺苷酸化,Deadenylation)和加尾(细胞质多腺苷酸化,cytoplasmic poly(A) denylation)。
脱腺苷酸化往往发生在尿苷化介导mRNA末端脱帽的5’至3’方向的RNA降解过程之前,也会发生在依赖于外泌体的3’至5’的RNA降解过程之前。因此,脱腺苷酸化不仅是mRNA降解的一个关键预兆,也是调控基因表达的一个重要步骤。通过CCR4-NOT复合体和PAN2-PAN3复合体的协作,细胞能够精确控制哪些mRNA将被降解,哪些将暂时储存以备将来使用。这种机制使得细胞能够快速响应环境变化,通过调控mRNA的稳定性来调整蛋白质的合成速率。例如,在细胞需要快速增殖或应对压力的情况下,CCR4-NOT复合体可能会加速特定mRNA的脱腺苷酸化,从而促进其降解,减少相应蛋白质的合成。另一方面,当细胞需要保留某些mRNA以备不时之需时,这些mRNA可能会经历脱腺苷酸化,但不会立即被降解,而是被储存在细胞质中,等待适当的信号触发细胞质多腺苷酸化,重新激活其翻译潜能。
细胞质多腺苷酸化是细胞调控机制中的一个重要环节,通过依赖于细胞质多腺苷酸化元件(CPE)驱动的多腺苷酸化,细胞能够激活特定mRNA的翻译以及关键蛋白的合成,从而快速响应环境变化或内部信号。例如,在哺乳动物中减数分裂中生殖细胞的形成,或在炎症反应中免疫因子的产生,或在学习和记忆过程中神经递质的释放。这种调控方式的高效性和特异性,使其成为细胞适应环境和维持功能的重要机制之一。较长的poly(A)尾通常促进更有效的翻译,然而poly(A)尾巴长度与翻译效率之间的关系在不同细胞类型中并不一致,这说明poly(A)尾介导的调控网络的高度复杂性和细胞特异性。
通过poly(A)尾长度来调控基因表达,不仅涉及脱腺苷酸化的增强或多腺苷酸化的转变,还包括CCR4-NOT复合体或TENT等调控因子的抑制,这些因素精细地调控着poly(A)尾巴的长度。这种对基因表达的精准控制确保了蛋白质有效和合适地合成,这对于发育过程和细胞对环境变化的响应至关重要。
图3:poly(A)尾长参与调控基因表达
05
poly(A)尾一定是由腺苷酸组成吗?
如前所述,传统意义上的mRNA分子的poly(A)尾只是一串位于mRNA 3’末端的由腺苷酸组成的序列,但已有研究表明,在poly(A)尾的3’末端或是内部,还存在着非腺嘌呤核苷酸,其中可能包括尿苷酸(U)、胞苷酸(C)和鸟苷酸(G)。非腺嘌呤核苷酸的存在以及poly(A)尾长度的变化,表明转录后调控机制更为复杂和深远。
(1) poly(A)尾末端的非A残基
在体细胞中,尿嘧啶残基(U)频繁出现在poly(A)尾巴的3’末端,并且不同的mRNA有超过5%的poly(A)尾在其3’末端均带有U残基。3’末端的尿苷化主要发生在poly(A)尾较短(通常少于约25个核苷酸)的mRNA中,这表明它与脱腺苷酸化过程有所关联。事实上,3’末端尿苷化的速率与mRNA的半衰期呈负相关。从机制上来看,被靶向降解的mRNA首先被脱腺苷酸化至小于25nt,随后失去与多聚腺苷酸结合蛋白(PABP)的结合,接着由非典型poly(A)聚合酶末端尿苷转移酶4/7(TUT4/7)催化3’末端的尿苷化,带有尿苷化poly(A)尾的mRNA随后可沿不同方向降解。这一机制对于在哺乳动物卵子生长期间降解不必要的转录本至关重要,如果尿苷化介导的mRNA降解过程受阻,则会导致缺陷性的卵母细胞,进而无法完成生殖过程。由此说明poly(A)尾3’端的尿苷化有助于mRNA或切割后mRNA片段的降解。因此,3’末端的U残基可由TUT4/7添加,作为mRNA调控信息,标记mRNA位点,而DIS3L2和LSM1-7可能作为这些标记位点的识别蛋白,能够识别poly(A)位点并作用于尿苷化的尾巴。此外,在植物中同样也有观察到poly(A)尾3’末端的U残基的存在,表明位于3’末端的尿苷化调控过程在生物体内普遍存在。
与3’末端的U残基不同,3’末端的鸟嘌呤(G)残基往往与较长的poly(A)尾巴(>40 nt)相关联。与此观察一致,3’末端的鸟苷化速率与mRNA的半衰期呈正相关。从机制上来看,G残基通过混合机制由非典型poly(A)聚合酶TENT4A/B催化掺入到poly(A)尾巴中。TENT4A/B可以催化大部分A残基的掺入,随后是G残基,以及少量的C和U残基。3’末端的poly(A)尾中G残基丰度较高可能是脱腺苷酸化过程倾向于在非腺苷酸残基处停止的结果,特别是在G残基处,因为G残基是CCR4-NOT复合体结合较弱的底物之一。实验研究表明,当使用完全重组的人CCR4-NOT复合体时,G、C和U残基在体外有效减缓了脱腺苷酸化过程。这一特性导致CCR4-NOT介导的脱腺苷酸化过程中,脱腺苷酸化倾向在非腺苷酸残基处停止,由此解释了在稳态poly(A)尾巴3’末端G残基优先出现的原因。因此,通过混合机制掺入poly(A)尾巴中的G、C和U残基可以作为mRNA调控信息,标记mRNA以抵抗活跃的脱腺苷酸化,从而提高稳定性,延长mRNA的半衰期。
(2) poly(A)尾内部的非A残基
除了调控mRNA的半衰期,poly(A)尾中G残基的频率已被证明在拟南芥中对PABP的结合和翻译效率有负面效应。然而在哺乳动物中,这些残基对翻译的影响机制更为复杂。使用含有非A残基的合成mRNA的研究显示,poly(A)尾中的胞嘧啶(C)残基可能通过稳定mRNA抵抗CCR4-NOT介导的脱腺苷酸化以增强目标蛋白的合成,然而这种效应在G残基上并未观察到。在重组的人CCR4-NOT介导的脱腺苷酸化过程中,C残基比G或U残基具有更显著的负面效应,这可能部分解释了为何C残基在poly(A)尾巴中对稳定mRNA翻译和增加蛋白质合成的效果更为明显。或者,非A残基可能在调控mRNA翻译效率方面具有额外的作用。已有研究通过使用在非A残基间穿插的合成poly(A)尾巴证实,这些残基能够单独发挥作用,实现对mRNA稳定性的影响并提高翻译效率。因此,目前关于poly(A)尾巴内部的非A残基与其对mRNA翻译的影响之间的关系仍然不清晰。
得益于poly(A)尾测序技术的快速发展,关于poly(A)尾巴内非A残基的调控机制相关研究正在逐渐深入。在合子基因组激活(ZGA)之前的哺乳动物胚胎和成熟卵母细胞中,poly(A)尾的非A残基丰度极高。例如,在人类ZGA前胚胎中,超过50%的poly(A)尾巴在其内部含有U残基,而在处于第二次有丝分裂中期(MII)的人类成熟卵母细胞中,约40%的poly(A)尾巴在3’末端特征性地具有U残基。由此可以表明卵母细胞到胚胎转变期间的poly(A)尾动态调控变化涉及整体的脱腺苷酸化、成熟卵母细胞poly(A)尾的尿苷化以及受精后的重新多腺苷酸化,并通过这一过程生成内部含有U残基的poly(A)尾。此外,在ZGA之前的四细胞阶段还观察到末端U残基的二次加入。尽管这种整体的poly(A)尾重编程的分子机制仍有待揭示,但这种重编程对于繁殖至关重要,因为阻止受精后的重新多腺苷酸化实际上会阻碍合子细胞的首次分裂。
在小鼠、大鼠和猪中也观察到了相似的poly(A)尾巴介导的母源mRNA重编程模式,这表明在哺乳动物物种间存在一种影响生殖发育的保守机制。在斑马鱼和非洲爪蟾早期胚胎的poly(A)尾巴3’末端,以及斑马鱼早期胚胎的poly(A)尾巴内部,也发现了高丰度的非A残基,这表明在脊椎动物中存在与哺乳动物相似的poly(A)尾巴非A残基的动态调控机制。
非A残基在多聚腺苷酸尾巴中的出现和消失,可能与特定mRNA的激活或沉默紧密相关,影响着胚胎早期发育的关键步骤。这种跨物种存在的保守调控机制,表明poly(A)尾在进化上的重要性及其在维持生命早期阶段正常发育过程中的核心作用。
图4:人类卵母细胞向胚胎转化的poly(A)尾重塑过程
总结与展望
现在我们可以知道,poly(A)尾不仅仅是一串简单的重复序列,而是一个在基因表达调控中复杂而精细的系统。poly(A)尾不仅可以通过尾巴长度调控表达,还可以通过内部或者末端的非A残基影响翻译过程,甚至可能还扮演着超出时空的额外调控角色。作为一个充满可能性的研究领域,poly(A)尾巴的表观遗传信息在揭示不同生物系统中基因表达调控机制方面具有巨大的潜力。随着Direct RNA测序等测序技术的发展,我们得以更深入地研究poly(A)尾的表观遗传调控机制,这不仅有助于mRNA疫苗和药物等转化医学和生物技术的创新和应用,而且极大地促进了生命科学与技术的进一步发展。
图5:poly(A)尾表观遗传调控模型
参考文献:
Liu J, Lu F. Beyond simple tails: poly (A) tail-mediated RNA epigenetic regulation[J]. Trends in Biochemical Sciences, 2024.