项目文章 | 百部线粒体基因组组装与进化分析揭示其结构、进化关系、细胞器间基因转移
近日,达州市农业科学研究院在BMC Plant Biology上发表了题为《Comparative analysis of mitochondrial genomes of Stemona tuberosa lour. reveals heterogeneity in structure, synteny, intercellular gene transfer, and RNA editing》的研究论文,首次组装百部线粒体基因组,并通过比较基因组分析,解析了百部线粒体基因组在结构、进化与分类地位、细胞间基因转移和RNA编辑事件中的特异性。
贝纳基因为本研究提供基因组测序、细胞器基因组组装、分析服务。
研究背景
百部(Stemona tuberosa)是传统中医药中重要的药用植物,具有补气、润肺等功效,尽管其叶绿体基因组已明确,但其线粒体基因组此前尚未被组装。尽管已有研究涉及化学成分、药理学、育种和质量评估,但其线粒体基因组的复杂性和动态性(如多分支结构、重复序列重组、基因水平转移等)限制了百部进化与分类学的深入研究。
研究结果
研究团队提取百部新鲜叶片DNA,使用Illumina和Nanopore测序技术,基于二代测序数据与三代测序数据混合组装线粒体基因组,最终得到了由3条环状染色体组成的百部线粒体基因组,基因组大小为605 Kb,GC含量为45.63%,包含66个基因。
图1 百部线粒体基因组图谱
通过密码子偏好性分析,研究团队发现,百部线粒体基因组表现出显著的密码子使用偏好性,在28个RSCU>1的密码子中,96.43%的第三位核苷酸倾向于以U/A结尾,表明该物种对特定核苷酸结尾的强烈偏好,与之前的研究结果相符。
图2 密码子偏好性分析
百部线粒体基因组274个简单重复序列(SSRs),分布呈现显著染色体偏好性:染色体1含236个,染色体2和3分别含22个和16个,在百部线粒体基因组中,共发现633个C→U RNA编辑位点,分布于38个蛋白质编码基因中,编辑位点分布高度不均。
图3 重复序列分析
通过序列比对发现,百部线粒体基因组中存在29个叶绿体来源的同源片段(MTPTs),总长度为66,408 bp,占线粒体基因组的10.96%。其中11个片段超过1,000 bp,最大片段MTPT18达14,798 bp。这些片段包含25个完整基因,包括16个蛋白质编码基因和9个tRNA基因,部分基因可能因功能丧失退化为假基因,但部分tRNA可能保留功能,暗示跨细胞器基因转移在能量代谢相关功能中的潜在作用。

图4 线粒体与叶绿体之间的同源性分析
百部与藏红花、海枣等5个物种的线粒体基因组共线性分析显示,尽管存在短同源共线性区块,但百部基因组中存在其他物种缺失的独特序列。不同物种间共线性区块的排列差异显著,结果表明线粒体基因组在进化过程中经历了广泛的基因重排事件,可能与重复序列介导的同源重组有关。
研究团队利用24个保守线粒体蛋白质编码基因构建了包含18个物种的系统发育树。结果显示,百部与露兜树目物种聚为一支,与被子植物系统发育组(APG)的最新分类一致。
图5 共线性分析
图6 百部与其近缘物种的系统发育树
本研究首次完成了中药植物百部线粒体基因组的完整组装与解析,揭示其多分支的环状染色体结构。研究了揭示其独特的密码子偏好性、重复序列比例与细胞器间基因转移,并通过系统发育分析证实了目前对于百部分类地位的结论,为百部属植物的进化、功能基因组学及药用资源保护提供了关键分子基础。