• Pan-genome: 寻找真正的我

    每个物种的基因组都不一样 ,想要了解一个物种内部的基因变化,

    以及物种与基因的关系,则可以借助泛基因组(pangenome) 来解决。

    泛基因组指通过基因组de novo组装策略,构建多个不同亚种或生态型的全基因组序列,

    从而完善该物种基因集并获得个体的特异基因信息。通过不同属/种/亚种内物种的测序分析,

    我们可以获得物种的 core-genome 和 unique-genome,进而进行深入研究。

  • 产品应用

    1

    挖掘种间关系

       泛基因组可分为核心基因组 (core genes),附属基因组(accessory genes)以及特有基因 (specific genes)这三部分。核心基因组是所有样品共有的基因,这些基因参与基础生物学过程,如能量产生、氨基酸代谢等。附属基因指存在于部分样品中的基因,这些基因与物种的多样性有关,赋予个体竞争优势。特有基因只存在于某一样品中,一般与物种对特定环境的适应性或特有的生物学特征相关,反映了物种的特性。针对不同但又相互关联的个体材料进行nanopore测序,单独进行组装,构建泛基因组图谱,以期获得该物种完整的遗传信息。

    2

    挖掘自己的品种

          在进化过程中,由于地域因素,环境因素等的影响,每个个体都形成了极其特别的遗传性状,单一个体的基因组已经不能涵盖这个物种的所有遗传信息,通过对不同品种基因组进行测序,组装,并进行整合注释,进而获取这个物种全部的遗传信息并且对每个个体间遗传变异信息进行解析。

    3

    挖掘深层信息

       选择不同亚种材料进行泛基因组测序,可以研究物种的起源及演化等重要生物学问题;选择野生种和栽培种等不同特性的种质资源进行泛基因组测序,可以发掘重要性状相关的基因资源,为分子育种提供科学依据;选择不同生态地理类型的种质资源进行泛基因组测序,可以开展物种的适应性进化,外来物种入侵性等热门科学问题的研究,为分子生态学等学科提供新的研究手段。

  • 三代oxford Nanopore测序

    长读长,低成本,大大降低研究费用,缩短项目周期

    MinION

    袖珍型测序仪

    512个纳米孔道

    每48h可产生10-20Gb数据量

    PromethION

    48个独立的测序芯片

    每个芯片3000个纳米孔道

    64h最多产生15Tb数据

  • 科学方案设计

    每一步,都需要科学、缜密的设计,以保障高质量研究成果。

    技术路线


       分别对多个个体进行De novo assembly,然后将所得的每个个体的assembly与reference基因组mapping,找出不同unmapped的区域,再进行进一步的assembly,然后注释,并进行下游分析

    信息分析


       泛基因组测序是对多个物种进行低/高深度的测序、组装和注释,通过构建泛基因组图谱,可得到这个物种的全部基因。同时还可对多个品种进行比较分析,挖掘品种特有的基因以及变异位点,这些变异位点以及特有基因往往与物种特有的生物学功能有关。

  • 参考案例

    泛基因组分析栽培稻和野生稻之间的差异

     

    文献名称:Pan-genome analysis highlights the extent of genomic variation in cultivated and wild rice

    发表期刊:Nature Genetics

    发表时间:2018年1月

    影响影子:27.125

  • 研究概述

    水稻是世界上最重要的农作物之一,也是碳水化合物的主要摄入来源。栽培稻和野生稻具有广泛的地理分布,能够适应多种生态和农艺条件。水稻基因组的遗传变异鉴定大多依赖于其序列与“日本晴”的相似性将短序列直接匹配到水稻参考基因组上,导致基因组中高度多态性区域的信息丢失。"日本晴"其实并不能覆盖栽培稻和普通野生稻中所有的功能基因。比如耐淹基因、磷高效基因在“日本晴”等水稻品种中完全缺失,因此该研究团队选取大量的样本进行深入探究。

    方案设计

    1 对1529份水稻品种进行聚类,对1083个栽培稻和446个野生稻的资源进行WGS测序,构建系统发育树,并选择57份代表性的材料,另外收集7份广泛使用的栽培品种,共66份材料。

    2 利用Illumina Hiseq 2500进行PE150或PE100测序,共产生3.1Tb数据,平均每个种质资源115X,同时对已测序的日本晴材料进行91X覆盖度的测序。

    3 利用SOAPdenovo和Fermi进行组装,利用GAPCloser进行scaffold链接。利用Mume软件进行基因组比对评估,同时利用Sanger测序对某些基因组的特定区域进行评估组装结果

    4 利用Mumer进行SV检测,使用samtools进行SNP和INDEL的分析

    研究结果

    1. 利用1529份材料的系统发育树进行研究,确定了22份粳稻,5份热带粳稻,1份泰国香米,19份籼稻,6份aus水稻和13份野生水稻进行pan-genome分析。组装平均N50为40.5k。对日本晴基因组分析,有3%的区域基因组富集错误,其余区域组装相对完美,超过96% cDNA有全长的序列结果。
    2. 构建了水稻泛基因组图谱,发现了16M SNP,5M INDEL和933k 的SV。其中3.2%的SNP,2.5%的INDEL和2%的SV位于有基因注释的编码区,其中等位基因分布大部分都集中与少数的几个种质中。

    3. 使用SNP和INDEL变异位点构建系统发育树,基本的物种进化模式与1529个水稻的模式一致。在新发现的7个水稻基因组人工选择位点的研究表明,aus种质在不同的选择位点位于不同的进化枝中。因此,aus可能发生了更多的选择和驯化事件。

    4. 选择与花期、抗性、粒重,分蘖和株高相关的5个重要的QTL位点,分析不同材料之间的基因来源,本研究共获得Hd3aCOLD1GW6aTAC1Sd1的等位基因频率。

    5. 对这些基因的功能研究表明,控制基本生物过程的基因家族(例如氨基酸转运蛋白家族和过氧化物酶家族)含有比植物免疫学更少的错义变体。发现一些功能性基因,如waxyHd1,存在多种等位基因

    6. 在O. rufipogon品系W1943染色体上新鉴定到二百多个组特异的编码基因

    7. 比较鉴定了水稻基因组中的2300万个序列变异,并对水稻各类群材料中编码基因的系统鉴定和存在-缺失变异分析。在67个水稻中,日本晴的基因组中共有大约1W个基因至少部分缺失,并检测到了新鉴定的基因中包含重要功能的基因,包括抗涝性和缺磷耐受性的基因。同时,在很多与开花时间相关的基因中也存在大量的PAV。