GB项目文章:DRS测序揭示转座因子驱动棉属植物转录调控演化

英文标题:Widespread impact of transposable elements on the evolution of posttranscriptional regulation in the cotton genus Gossypium
发表期刊:Genome Biology(IF:10.1)
发表时间:2025.3
转座因子(Transposable Elements, TEs)作为基因组中的跳跃元件,可以通过插入、复制和移动塑造等方式,影响基因组的结构与功能,是推动物种进化和表型多样性的重要驱动因素。尽管转座因子对基因组结构变异和转录调控的影响已被广泛研究,但是其在物种分化后是如何调控转录后水平仍不明确。
近日,华中农业大学王茂军教授团队在Genome Biology期刊(IF=10.1)上发表了题为Widespread impact of transposable elements on the evolution of posttranscriptional regulation in the cotton genus Gossypium的研究论文,研究利用长读长直接RNA测序(DRS)、翻译组测序(Polysome-seq)和小RNA测序等多组学技术,系统分析了八个二倍体棉种中转座因子对基因表达调控的影响,首次揭示了转座因子在转录、剪接、翻译三个层面驱动棉属进化的关键机制,加深了我们对生物多样性和适应性进化机制的认知,为棉属植物品种改良及分子育种提供了科学依据和理论参考。
贝纳基因参与了该项目Direct RNA测序工作。
研究结果
1. 棉属基因组中转座因子的分布模式与特征
为了系统解析转座因子(TEs)在棉属物种基因组演化中的作用,研究对八个二倍体棉种的TE分布特征进行了全面分析,结果显示TE在不同棉种之间存在差异扩张,并且多数呈现谱系特异性(图1a)。基因组进化分析发现物种特异性基因显著富集TE,推测TE插入可能通过产生新基因驱动物种适应性进化(图1b),同时,单拷贝直系同源基因的保守TE插入事件数量,在亲缘关系近的物种间相似,在亲缘关系较远的物种间差异显著(图1c)。由此表明TEs可能影响基因结构和功能,在棉种遗传分化中发挥关键作用。

图1:棉属基因组中转座因子的分布模式与特征
2. 转座因子调控同源基因转录差异
研究分析八种棉花的基因转录情况,发现部分基因在某些棉种中不表达或仅在部分棉种中表达(图2a)。在那些仅在部分棉种表达的基因里,DNA转座子差异插入占比较高,可能影响基因转录,例如基因Grai_10G013610在D5上游2kb区域存在DNA转座子插入,无表达信号,而其在A2中的同源基因Garb_10G013290表达水平较高;在差异表达的直系同源基因中,以LTR反转录转座子差异插入为主,其可以通过影响转录因子的结合,进而调控基因表达,例如A2中基因Garb_09G019690上游插入的LTR反转录转座子TE1502079含有MYB转录因子结合位点,其表达水平显著高于D5中的同源基因(图2b~e)。此外,在具有谱系特异性LTR插入的分支中,相关基因的表达水平显著高于其他分支(图2f),而DNA转座子的插入则表现出相反的调控效应。由此表明,不同类型的TEs可以通过不同的分子机制调控棉属物种同源基因的转录活性。

图2:转座因子调控同源基因转录差异
3. 转座因子介导可变剪接驱动同源基因转录本分化
对八个二倍体棉种进行长读长RNA直接测序,分析不同棉种的转录本结构变化,发现棉种间转录本异构体数量和结构存在差异,其中约50%的基因可形成2种以上的转录本(图3a)。TE富集与转录本数量相关性分析显示,部分TE可引入新剪接位点增加转录本数量,也有TE因引入提前终止位点减少转录本数量(图3b~e)。通过可变剪接分析发现,存在TE插入的基因更为容易发生可变剪接,并且可变剪接产生的转录本TE富集分数更高。此外特异的TE差异插入可以导致部分基因主要转录本结构不同,影响直系同源基因转录本结构分化(图3f~k)。由此表明,TEs可以通过介导可变剪接事件发生,显著增加转录本的结构多样性。

图3:转座因子介导可变剪接驱动同源基因转录本分化
4. 转座因子衍生的uORF调控基因翻译效率
研究通过翻译组测序分析八个二倍体棉种的翻译效率差异,发现转录组和翻译组相关性介于0.73~0.90之间,并且翻译水平变化普遍大于转录水平(图4a~d)。鉴定得到大量转录无差异但翻译有差异的基因,而这些基因的5'端具有更多特异性uORF,同时,含有特异性uORF的基因翻译效率显著更低(图4e~f)。uORF由差异TE插入引入,当基因含有特异性uORF时,其5'区域TE覆盖度更高,而且翻译效率显著较低(图4h~i)。由此表明,转座因子衍生uORF调控同源基因的翻译效率,影响不同棉种基因翻译水平和谱系分化。

图4:转座因子衍生的uORF调控基因翻译效率
5. 转座因子衍生miRNA调控基因翻译效率
通过对不同棉种进行小RNA测序,发现部分miRNA和siRNA靶向位点并不保守,并且miRNA靶基因翻译效率显著低于非靶基因(图5a~b)。此外还发现,TE对miRNA靶基因翻译效率的抑制作用与TE的富集程度呈现正相关,尤其是LTR反转录转座子中显著富集miRNA靶向位点(图5c~e)。推测TE可通过产生miRNA降低存在靶位点的转录本的翻译效率,或引入新剪接位点,产生逃避miRNA调控的转录本(图5f~g),从而改变编码蛋白的结构和功能,进而影响棉种基因翻译和谱系分化。

图5:转座因子衍生miRNA调控基因翻译效率
6. 棉属进化中同源基因的多水平分化
进一步分析棉种4个主要进化分支D5、E1、clade1、clade2的直系同源基因在转录、剪接和翻译三个水平的表达情况,发现基因表达调控在棉种分化过程的不同调控层次中呈现动态变化和差异显著的特点。例如OG0012439基因在clade1呈现转录水平特异性,而在clade2则表现出翻译水平特异性(图6a~b)。基于棉属系统发育关系,将棉花进化过程划分为四个关键阶段,每个阶段均有不同数量的差异表达基因(DEGs),并且大部分DEGs的表达差异由TE插入引起。同时不同阶段DEGs功能富集模式也呈现出差异性和特异性,阶段2(D5分化)主要富集于色素代谢过程;阶段3(E1分化)与胁迫响应相关;而阶段4(clade1与clade2分化)则显著富集纤维发育相关基因(图6c),由此反映了棉种进化过程中的TE通过多层级调控网络驱动物种的功能变化。

图6:棉属进化中同源基因的多水平分化
研究总结
本研究长读长直接RNA测序、翻译组测序及小RNA测序等多组学技术,系统分析了转座因子介导的转录后调控在多个棉种分化中的关键作用,详细阐明了转座因子通过调控转录、剪接和翻译三个层次,驱动棉属物种分化的分子机制。研究表明转座因子的扩张可以改变剪接位点和调控序列,影响直系同源基因的可变剪接和表达水平,同时还通过引入uORFs和miRNA等衍生调控元件,介导调控基因翻译水平,由此塑造了棉花物种的转录组和翻译组多样性。这些发现为理解植物适应性进化及作物遗传改良提供了重要理论依据。
参考文献:
Tian X, Wang R, Liu Z, et al. Widespread impact of transposable elements on the evolution of post-transcriptional regulation in the cotton genus Gossypium[J]. Genome Biology, 2025, 26(1): 60.
027-62435310 |
service@benagen.com |
