顶刊解读|野生和栽培大麦泛基因组的结构变异
近日,德国IPK莱布尼茨研究所领导的国际研究团队在国际著名期刊《Nature》(影响因子50.5)发表题为Structural variation in the pangenome of wild and domesticated barley的研究论文。
研究通过76个高质量大麦基因组(包含野生和栽培种)以及1,315个大麦二代重测序数据的基因型数据,构建了大麦高质量泛基因组。研究团队通过大麦泛基因组,展示了大麦基因组的多样性和结构变异,重点关注参与抗病性、植物结构、营养物质分解和毛状体发育等基因座,为与农艺性状相关的基因座研究提供了新的视角。研究成果有助于揭示大麦的环境适应性机制,为未来的作物驯化和育种提供了理论基础和候选基因。
研究背景
大麦(Hordeum vulgare),作为人类最早驯化的作物之一,其基因组受到了人类驯化的选择影响,现代大麦与其野生祖先在分枝数量、籽粒或果实产量以及生长周期等方面均存在差异。因此通过构建大麦泛基因组研究大麦性状的需求日益迫切。
研究内容
研究团队使用76个高质量大麦基因组(包含野生和栽培种)以及1,315个大麦二代重测序数据的基因型数据,构建了大麦高质量泛基因组。为了量化泛基因组PAV程度,以泛基因组为基础构建了一个以基因为中心的同源框架,共鉴定得到95237个分层直系同源群 (hierarchical orthologous groups, hOGs),其中16672个被包含于泛基因组的核心基因中。

大麦全物种泛基因组
根据前期研究,抗性基因的进化与复杂结构基因座密切相关,这些结构复杂的基因座经历了基因拷贝突变以及通过缺失/重组产生的同源基因家族分化。文章中以白粉病抗性基因座a (Mla)为例,这个基因座在品种RGT Planet中存在一段长度为40K、包含两个Mla基因家族成员的区域,并且被头对尾地重复了四次。然而在泛基因组中的62份材料中,这段区域即使是一个完整的Mla拷贝也不存在,但其中存在149个与Mla核苷酸相似度达到98%的高度相似的同源基因。研究团队提出,这种结构复杂、包含多个同源抗性基因的基因座如何改变了大麦对白粉病或其他疾病的抗性,仍有待于研究。大麦泛基因组将有助于研究这种序列的多样性导致基因拷贝数的改变与白粉病或其他疾病的抗性变化。

淀粉酶1_1位点的结构多样性及其在麦芽制作中的重要性
α-淀粉酶基因amy1_1基因座是目前大麦研究中最具有经济价值的基因位点,它编码的淀粉酶将多糖淀粉裂解成短链形式,影响野生大麦的长势和生存能力以及栽培品种的淀粉分解(酿酒)能力。研究团队用PGGB构建局部泛基因组图谱,通过聚类分析,发现基于结构特征进行的聚类结果与amy1_1拷贝数存在显著的相关性。这一结果为针对amy1_1位点的选择性育种以及amy1_1单倍型的培育提供了基础。

增强子基序的缺失与SRH1依赖的毛状体发育相关
有研究表明,大麦谷粒穗轴上的毛状体颖毛长度变化与驯化过程相关,目前通过诊断标记预测这一特征是育种学的研究难题。研究团队使用FIND-IT和Cas9介导的靶向突变获得了几个突变体,并进行突变分析,证明了大麦穗轴上颖毛的长度由基因HvSRH1控制。通过调控变异研究,研究团队发现长颖毛组样本HvSRH1基因上存在一段4,273 bp的区域,此序列与拟南芥中SMR表达调节因子基序匹配,并且短颖毛组所有样本都缺失了该序列。研究团队猜测假定的增强子区域参与了HvSRH1的转录调控,进而影响毛状体发育与颖毛长度。
总 结
研究团队使用76个高质量大麦基因组(包含野生和栽培种)以及1,315个大麦二代重测序数据的基因型数据,构建了大麦高质量泛基因组。为了展示大麦泛基因组在育种与基因研究方面的研究意义,研究团队使用了抗病性、生存能力、淀粉分解和毛状体颖毛长度相关的基因座作为案例,展示了大麦泛基因组在挖掘农艺性状调控机制方面的重要作用。