Journal of Advanced Research|泛基因组分析揭示了金针菇驯化过程中的基因组变异
文章标题:Pan-genome analysis reveals genomic variations during enoki mushroom domestication, with emphasis on genetic signatures of cap color and stipe length
发表期刊:Journal of Advanced Research (IF 11.4)
发表单位:中国科学院微生物研究所真菌学国家重点实验室
发表时间:2024.11
研究内容
本研究对199株野生和培养金针菇菌株进行了从头基因组组装和泛基因组构建,同时使用SNP-GWAS及PAV-GWAS,结合RNA测序,以识别与驯化性状相关的基因。研究发现栽培种群和野生种群之间存在显著的基因组变异,包括驯化过程中抗性基因的缺失。本研究还鉴定了与帽色和茎长相关的关键基因,首次证明了PAV变异在金针菇驯化中的重要作用。这些见解为未来的金针菇育种和进化研究提供了基础。
研究背景
食用蘑菇驯化历史相对较短,了解驯化过程中经过人工选择的性状的遗传特征不仅对阐明驯化至关重要,而且对育种具有重要的科学价值。金针菇(Flammulina filiformis),属于担子菌门的蘑菇目,在许多国家广泛种植,特别是在东亚。在其自然状态下,丝状花序花表现出黄色的帽色和相对较短的柄,但驯化导致了白色帽和长柄品种的出现。尽管其具有商业意义,但诸如帽色和茎柄长度等性状的遗传机制仍不清楚,这阻碍了培育具有理想特性的改良品种的研究。本研究构建一个金针菇的泛基因组,结合来自栽培和野生菌株的遗传成分,通过考虑PAV和SNPs,捕获与驯化和生理性状相关的更广泛的遗传变异。
研究结果
金针菇遗传多样性与遗传结构
对199株金针菇群体进行重测序,发现5,431,360个SNPs位点。STRUCTURE分析显示,该群体存在4个不同的种群(图1B)。栽培菌株形成3个群体,野生菌株独立为一个群体。利用PCA和系统发育树(图1d和F)进一步验证了种群结构。系统发育分析表明,栽培菌株1、2和3群体,可能来自于不同野生菌株的三个独立的驯化过程。
遗传多样性分析显示,野生菌株的遗传变异明显高于栽培菌株。LD衰减分析显示,野生种群的衰减速度较快(图1E)。遗传分化分析(FST)显示栽培菌株2与野生菌株的分化最大(FST = 0.245),栽培菌株1与野生菌株的分化最小(FST = 0.06774)。通过计算FST和Tajima’s D,我们鉴定到包含662个基因的基因组区域,在栽培和野生菌株之间表现出高度的遗传差异。

图1 金针菇群体遗传结构
从头基因组组装、注释和泛基因组构建
对上文的199个菌株进行全基因组组装,最终组装的基因组大小从34.3 Mb到43.2 Mb,平均为38.2 Mb。BUSCO评估为93.6 %,表明基因注释具有较高的完整性。同时,对199个组装好的基因组进行了泛基因组分析。所有基因划分为19,460个基因家族。6368个基因家族出现在198到199个菌株(>99 %的集合)被定义为core genes,2046个基因家族出现在190至197株(>95 %的集合)被定义为softcore genes,10668个基因家族显示在2到189个菌株被定义为dispensable genes,378个基因家族仅出现在一个菌株被定义为specific genes(图2B)。
泛基因组中水平基因转移(HGT)的证据
HGT分析显示,有40个基因可能通过HGT事件获得,主要来自细菌。为了评估这40个HGT获得性基因推断的可靠性,我们进行了污染检测,发现这些基因均未被鉴定为潜在污染物。基因注释发现许多HGT获得性基因参与碳水化合物和氨基酸代谢过程。
驯化过程中的基因存在/缺失变异(PAV)的选择
在泛基因组构建后,对基因PAV进行比较发现,野生菌株的平均基因数(14857个)高于栽培菌株(13782个)(图2E)。基因的丢失反映了基因组大小的总体减少,现代栽培菌株的平均基因组大小为37 Mb,而野生菌株的平均基因组大小为40Mb(图2E)。尽管平均基因数量下降,但在整个种群中特定基因的频率存在增加和下降的复杂模式。在这里,两组之间频率显著不同的基因(即野生和栽培)被称为选择基因。我们将品种中频率较高的基因视为驯化有利,将频率较低的基因视为不有利。在驯化过程中,我们鉴定出了200个有利基因和1129个非不利基因(图2F)。GO分析表明,驯化过程中最丰富的不利基因群是内酰胺酶和内酰胺抗生素分解代谢过程。但也观察到一些有趣的有利基因,包括一个重金属相关结构域含基因(OG0011908)和一个精氨酸酶(OG0011208)。这些分析表明,在驯化过程中,许多不利基因丢失,而相当多的有利基因被保留。

图2 金针菇泛基因组及PAV选择
基于SNP和PAV的驯化过程中帽状颜色变化的GWAS分析
在基于SNP的GWAS分析中,在7个基因中有23个SNP与帽的颜色显著相关(图3a)。在这23个snp中,有8个位于基因中,15个位于基因间区。基于PAV的GWAS分析,鉴定了20个与帽颜色相关的基因(图3b),包括OG0001490(编码一个功能未知的结构域PF10846)、OG0018599(编码一个DEAD/ DEAH盒子解旋酶结构域PF00270)、OG0016474(编码一个5-amp激活蛋白激酶PF04739)和OG0016582(编码一个UCH结合结构域PF16550)。有趣的是,OG0001490也被鉴定为一个不利基因,表明其基因可能与驯化和帽状颜色有关。
驯化过程中的转录组变异
为了研究驯化过程中全基因组基因表达模式的变化,我们分析了3个具有代表性的野生菌株和1个栽培菌株的转录组(图3c-g)。发现栽培菌株全基因组基因集的表达多样性值低于野生菌株。进一步分析200个有利基因和1129个不利基因的基因表达多样性,发现驯化基因集的表达多样性显著降低,提示人工选择的基因可能导致了驯化过程中基因表达多样性的降低。在这些DEGs中,我们检测到3个同时由基于PAV的GWAS和DEGs鉴定的基因(图3G)。

图3 GWAS分析及转录组变异
影响帽颜色和柄长度的基因的过表达(OE)和RNA干扰(RNAi)
为了验证三个基于PAV的GWAS鉴定基因(FfB、FfC和FfD)和一个基于SNP的GWAS鉴定基因(FfA)与驯化,特别是帽色相关的功能,本研究使用突变体进行了OE和RNAi实验。分析显示,基因FfB和FfD可能与帽的颜色调控有关。此外,早期帽的颜色与成熟子实体的柄长有显著的相关性。
总 结
综上所述,在驯化过程中,金针菇遗传多样性和表达多样性显著降低。通过从头基因组组装、基于基因的泛基因组分析和HGT分析,我们鉴定了与-内酰胺抗生素分解代谢过程相关的基因和驯化过程中特定的MAPK通路基因的丢失。栽培菌株对病原体敏感性的增加可能是由于在受控的栽培环境中对抗病性的选择压力的降低。因此,栽培菌株可能失去了野生菌株中仍然存在的某些防御机制。此外,通过将基于PAV的GWAS与RNAseq数据和遗传转化实验相结合,鉴定了两个与帽状颜色和茎柄长度相关的基因。本研究全面的泛基因组和群体基因组分析为金针菇的进化和驯化提供了有价值的见解,为育种和未来的研究提供了重要意义。