叶绿体基因组
小基因组包括线粒体基因组及叶绿体基因组。叶绿体和线粒体基因组具有高度的保守性,其主要表现为母系遗传。应用高通量测序和生物信息分析技术进行基因组组装、基因结构预测,对研究物种进化、分类、遗传多样性等有重要的意义。
技术特点(优势):
(1)小基因组测序,速度快;
(2)二代/三代相结合,接近0 gap的完美组装;
(3)助力物种分类、系统进化、谱系地理研究;
(4)价格便宜

项目文章
Liu Y.#, Li D.#, Zhang Q.#, Song C.#, Zhong C.#, Zhang X., Wang Y., Yao X., Wang Z., Zeng S., Wang Y., Guo Y., Wang S., Li X., Li L., Liu C., McCann H., He W., Niu Y., Chen M., Du L., Gong J., Datson P., Hilario E. and Huang H. Rapid radiations of both kiwifruit hybrid lineages and their parents shed light on a two-layer mode of species diversification. New Phytologist, 2017, 215(2). (IF = 7.299)
Wang S , Song Q , Li S , et al. Assembly of a Complete Mitogenome of Chrysanthemum nankingense Using Oxford Nanopore Long Reads and the Diversity and Evolution of Asteraceae Mitogenomes. Genes, 2018, 9(11). (IF = 3.331)
公司高分文章
Song C.# Liu Y.#, Song A.#, Dong G.#, Zhao H.#, Sun W., Ramakrishnan S., Wang Y., Wang S., Li T., Niu Y., Jiang J., Dong B., Xia Y., Chen S., Hu Z., Chen F., Chen S. The Chrysanthemum nankingense genome provides insights into the evolution and diversification of chrysanthemum flowers and medicinal traits. Molecular Plant, 2018.(IF = 10.812)
Liu Y.#, Li D.#, Zhang Q.#, Song C.#, Zhong C.#, Zhang X., Wang Y., Yao X., Wang Z., Zeng S., Wang Y., Guo Y., Wang S., Li X., Li L., Liu C., McCann H., He W., Niu Y., Chen M., Du L., Gong J., Datson P., Hilario E. and Huang H. Rapid radiations of both kiwifruit hybrid lineages and their parents shed light on a two-layer mode of species diversification. New Phytologist, 2017.(Co-first Author) (IF = 7.299)
Reyes-Chin-Wo S., Wang Z., Yang X., Kozik A., Arikit S., Song C., Xia L., Froenicke L., Lavelle D., Truco M., Xia R., Zhu S., Xu C., Xu H., Xu X., Cox K., Korf I., Meyers B, Michelmore R. Genome assembly with in vitro proximity ligation data and whole genome triplication in lettuce. Nature Communication, 2017. (IF = 11.878)
Q1:什么是叶绿体基因组?
叶绿体基因组是存在于植物叶绿体中的独立DNA分子,主要编码光合作用相关蛋白、转运RNA(tRNA)和核糖体RNA(rRNA)。与核基因组相比,叶绿体基因组体积小、结构相对保守,并具有环状或准环状结构。
Q2:叶绿体基因组有哪些特点?
· 大小适中:大多数植物叶绿体基因组在12–200 kb之间;
· 结构保守:通常由两个逆重复区(IR)和两个单拷贝区(LSC和SSC)组成;
· 基因数量稳定:编码约110–130个基因,主要涉及光合作用、转录与翻译;
· 突变率低:序列进化速率较慢,是植物系统发育分析的理想分子标记;
· 母系遗传为主:大多数高等植物叶绿体通过母系传递。
Q3:叶绿体基因组在科研中的价值是什么?
· 系统发育研究:保守序列适合用于物种鉴定和系统进化分析;
· 植物分类与物种鉴定:常用作DNA条形码(如rbcL、matK);
· 光合作用及功能基因研究:解析光合复合体基因及调控网络;
· 进化与驯化研究:分析野生与栽培品种的遗传差异及适应性。
Q4:叶绿体基因组组装有哪些常见挑战?
· 逆重复区(IR)重复:可能导致组装断裂或错位;
· 多拷贝和同源序列:不同细胞或组织中叶绿体DNA数量差异可能影响数据均一性;
·与核基因组或线粒体基因组的序列转移:需区分叶绿体来源的DNA与其他细胞器序列(nupDNA/mptDNA);
· 异质性(heteroplasmy):同一植物体内可能存在略有差异的叶绿体基因组拷贝,影响组装精度。
项目案例

文章题目:Assembly and analysis of the first complete mitochondrial genome of Punica granatum and the gene transfer from chloroplast genome
发表期刊:Frontiers in Plant Science
期刊分区:JCR一区,中科院(PLANT SCIENCES 植物科学 1 区,生物学 2 区 Top)
发表时间:2023.06.21
主要研究成果:
1. 线粒体基因组组装及结构特征
采用BGI+Nanopore长短reads混合组装策略,将线粒体组装成图形化的基因组,并且简化为单一的线性分子结构用于参考基因组,如图1所示。最终得到总长度为404,807 bp,GC含量为46.09%。对石榴的线粒体基因组进行注释,共鉴定出37个独特的蛋白质编码基因,包括24个独特的线粒体核心基因和13个可变基因;20个tRNA基因(包括7个多拷贝的tRNA),以及3个rRNA基因。核心基因包括5个ATP合成酶基因,9个NADH脱氢酶基因,4个泛醌细胞色素c还原酶基因,3个细胞色素c氧化酶基因,1个膜转运器基因,1个成熟酶基因和1个泛醇细胞色素c还原酶基因;可变基因包含4个核糖体大亚单位基因,8个核糖体小亚单位基因,以及1个琥珀酸脱氢酶基因。

图1 石榴线粒体基因组图谱
2. 重复序列及其迁移
SSR标记在物种鉴定和遗传多样性评估中有重要应用,本研究发现石榴的线粒体基因组中存在大量的重复序列,具体分布情况见图2。全基因组中共发现146个SSR为石榴种质多样性评估和物种鉴定提供了大量的参考标记,其中以单体和二聚体形式的SSRs占总SSRs的55.48%。在61个单体SSR中,腺嘌呤(A)单体重复占44.26%;AT、GA和TA重复是最常见的类型,占二聚体SSR的60.00%。同时,在石榴线粒体基因组中,检测到16个匹配度超过81%,长度为12~29 bp的串联重复序列。此外,线粒体基因组中还检测到400对长度大于或等于30 bp的分散重复序列,包括179对回文重复、220对正向重复和1对逆向重复。有趣的是,并没有发现互补性重复序列。
研究同时组装了石榴叶绿体基因组,大小为158,638 bp(图3)。根据序列相似性,线粒体基因组中观察到14个与叶绿体基因组同源的DNA片段,总长度为2200 bp,占整个线粒体基因组长度的0.54%。其中,有7个完整的基因,都是tRNA基因,最长的片段长度是716 bp。值得注意的是,由于大部分迁移序列在演化过程中失去了其完整性,现在只有一部分可以在线粒体基因组中找到。与蛋白质编码基因的序列迁移相比,tRNA基因在线粒体基因组中更为保守,表明它们在线粒体中的不可替代角色。

图2 石榴线粒体基因组重复序列
注:图A中C1圈的颜色线连接着两个重复的散在重复序列。蓝色、粉色和绿色的线分别代表回文重复、正向重复和反向重复;C2圈表示短条的串联;C3圆圈表示SSRs。图B表示SSRs的类型和数量。

图3 石榴叶绿体的基因组图谱(A)及序列迁移情况(B)
注:图B中蓝色弧线代表线粒体基因组,绿色弧线代表叶绿体基因组。
3. 系统发育及序列共线性分析
长期以来,科学界对石榴属的分类地位存在争议,以前人们认为它单独属于石榴科,但最近有研究证据表明它应该是桃金娘目千屈菜科的一员。本研究基于18个保守的线粒体PCGs序列,对包括石榴在内的4个目的30个物种进行了系统发育分析(图4)。结果表明,石榴与桃金娘目千屈菜科的紫薇关系密切,而基于线粒体DNA的系统发育的拓扑结构与被子植物系统发育群体(APG)的最新分类一致。本文分析了7个桃金娘目物种的共线性,结果表明,虽然在石榴和其他桃金娘科物种中检测到许多的同源共线块,但这些共线块的长度相对较短,表明线粒体基因组非保守性较高,证明它们在长时间的演化过程中经历了极为频繁的基因组重组。此外,我们在这些物种也中发现了一些独特的空白区域,与其他物种没有同源性。

图4 系统发育(A)及共线性分析(B)
注:图A显示了bootstrap值,不同颜色对应不同的目。图B展示了七个物种之间的共线性关系,其中红色弧形区域表示倒位区域,灰色区域表示具有良好同源性的顺序区域。
4. RNA编辑事件及验证
通过比较石榴线粒体基因组的DNA和RNA序列的差异,使用BEDTools软件在37个线粒体PCGs上鉴定出580个潜在的RNA编辑位点,全部都是C到U的编辑(图6A),这些位点非常类似于其他陆生植物。其中,在ccmB和nad4基因中鉴定出47个位点,在所有线粒体基因中编辑次数最多。其次是ccmFN基因(35个RNA编辑事件),而rps12基因只预测出一个RNA编辑事件。令人惊讶的是,在预测RNA编辑事件的线粒体基因中,rps12的编辑次数最少。此外,为了确认RNA编辑位点的正确性,使用在线网站PREPACT在相同的37个线粒体PCGs上预测了432个RNA编辑位点,它们也是C到U的编辑(图6B)。在cox2和nad7基因中分别预测了一个从ACG(苏氨酸)到AUG(起始密码子)的编辑事件。
基于RNA-seq映射结果,本研究验证了4个能创建起始和终止密码子的RNA编辑位点。PCR产物和序列比较结果显示在图7中。它们是atp9的终止密码子、nad1的起始密码子、rps10的起始密码子和终止密码子。很明显,在植物线粒体基因组中,RNA编辑事件导致了起始和终止密码子的改变,这可能会影响线粒体功能和细胞代谢。然而,无论是否是由于RNA编辑事件在起始位置被激活的现象,都没有得到转录组比较读数的支持,仍需要进一步的实验验证。

图5 石榴线粒体基因组PCGs中的RNA编辑位点
注:图A由BEDTools软件预测;图B由PREPACT在线网站预测
总 结
本研究采用BGI+Nanopore长短reads混合组装策略,成功测序并组装了石榴的线粒体基因组。线粒体以多分支为主,基因组总长度为404,807 bp,注释了37个独特的PCGs,并识别了146个SSR。此外,还检测到400对分散的重复序列,包括179个回文重复,220个正向重复和一个反向重复。研究检测到14个与叶绿体基因组同源的片段,总长度为2,200 bp,占线粒体基因组总长度的0.54%。系统发育分析表明,石榴与千屈菜科的紫薇有最密切的遗传关系。所发现的RNA编辑事件都是C-U编辑,并预测在cox2和nad7基因中分别有一个从ACG到AUG的编辑事件,该研究为了解高等植物的进化和石榴种质资源的利用提供了理论依据。