您好,欢迎光临武汉贝纳科技有限公司
027-62435310 | service@benagen.com | 中文 | English 咨询客服
您现在的位置:主页 > 市场与支持 > 文献解读 >

Nature 文章详解 | 从燕麦基因组入手,深入了解独特的健康谷物作物

 

文章简介

 

栽培燕麦(Avena sativa L.)是一种异源六倍体(AACCDD,2n=6x=42),被认为在3000多年前被驯化,在安纳托利亚区域的小麦、二粒小麦和大麦中作为杂草生长。本研究提供了A. sativa及亲缘关系较近的二倍体(Avena longiglumis、AA、2n=14)和四倍体祖先(Avena insularis,、CCDD、2n=4x=28)的高质量参考基因组,并进行深入解析。

 

该研究揭示了燕麦基因组的镶嵌(类似马赛克)结构,追踪了燕麦多倍体化历史中的大规模基因组重组,阐明与燕麦基因组结构相关的育种障碍,并进一步展示与人类健康和营养相关的基因家族分析,为支持无麸质饮食中燕麦的安全性提供证据。

 

基于组装好的基因组,对与燕麦表皮蜡相关的农艺性状进行定位。燕麦属的基因组资源将有助于研究人员对燕麦生物学的理解,并加速基因组辅助育种和数量性状研究的深入分析。

 

图片

 

文章标题:The mosaic oat genome gives insights into a uniquely healthy cereal crop

发表期刊:Nature

发表时间:2022.05

 

主要研究结果:

 

1、 基因组组装和构成

该研究使用PacBio CLR测序数据组装了一个燕麦“Sang”的染色体水平基因组,包含21条伪染色体(图1),BUSCO为98.7%,结合HiC和遗传图谱,并与已发表的六倍体燕麦OT3098进行比较,验证了组装的完整性。该研究同时组装了二倍体Avena longiglumis和四倍体Avena insularis的染色体水平基因组,推测它们可能是燕麦(Avena sativa)的A和CD亚基因组祖先。

 

图片

图1 21个燕麦伪染色体的结构展示图

 

该研究通过RNA-seq和Iso-seq转录组数据、蛋白质同源预测和从头预测来预测燕麦基因组中的基因模型。预测得到80,608个高置信度的蛋白编码位点(98.5% BUSCO),转座因子占燕麦基因组序列的64%。

 

2、 燕麦类似马赛克(Mosaic)的染色体结构

燕麦基因组的整体结构与小麦科的基因组相似,且燕麦基因组中频繁的重排导致得到一个类似于马赛克的基因组结构。对4种燕麦属植物的全基因组比对,共线性分析结果显示了大量大规模的基因组重排,影响了这些共线区块在亚基因组内和亚基因组之间的顺序(图2a)。该研究在A. sativa中检测到7个大规模的基因组重排,并将其追溯到A、C和D亚基因组之间的8个易位事件(图2b,c),跨越了4.3%的基因组和约7.9%的高可信度基因,其中有两个易位事件是A. sativa所特有的。

 

图片

图2 燕麦中的基因组组织、重排和亚基因组相互作用

 

3、 燕麦亚基因组表达保持平衡

物种经过多倍体化后,亚功能化和新功能化以及基因丢失改变了新物种的基因含量,亚基因组/同源基因表达的系统差异(同源基因表达存在差异)也可能普遍存在。为研究六倍体燕麦的同源基因表达差异,在三个燕麦亚基因组中定义了7,726个具有1:1:1对应关系的同源基因三元组,被称为祖先三联体。

 

6个组织转录组样本的平均表达值显示,C亚基因组基因的表达量(32.32%)略低于D(33.53%)和A亚基因组(33.76%)。该研究考虑了6个同源表达种类,发现大多数祖先三联体表现出平衡表达(84.1%),3.4%表现出单同源显性,12.6%表现出单同源抑制(图2d),不同类别的相对贡献分析表明,亚基因组间总体没有偏倚。

 

4、 可溶性纤维相关基因家族

该研究对糖基转移酶的纤维素合酶(GT2)和胼胝质合酶(GT48)基因家族进行分析,以确定燕麦β-葡聚糖生物合成的遗传基础。六倍体燕麦基因组编码纤维素合酶基因超家族的134个成员,CesACslF亚家族内的基因在种子发育的多个阶段中表达最多(图3a)。

 

图片

图3 A. sativa纤维素合酶和种子贮藏蛋白基因家族分析

 

此外,与其他草类相比,燕麦纤维素合成酶超家族除了在CesA、CslC、CslECslJ亚家族中发生重复事件外,没有明显的扩张。表明,燕麦中β-葡聚糖的高含量和质量,不是由纤维素合酶超家族基因相对于其他草类的拷贝数差异驱动的,而是由等位变异和转录因子驱动的,与此前报道的研究结论一致。

 

5、 燕麦储存蛋白质与人类健康

燕麦球蛋白占谷物蛋白质含量的75-80%,其中燕麦蛋白约占10-15%。该研究鉴定了编码25个燕麦蛋白、6个高分子量谷蛋白(HMW-GS)以及其他61个与蛋白积累和免疫原性相关的脯氨酸蛋白家族成员。

 

六倍体燕麦在1D、3D和7A染色体上有燕麦蛋白位点;1A、1D、3D、7A、4A和4D染色体上有种子储存球蛋白位点(135个基因),C亚基因组没有定位到储存蛋白位点(图3b)。

 

该研究检测了大多数燕麦蛋白基因的转录本,其基因表达模式与小麦同源基因一致,从种子发育中期开始的转录本水平增加(图3c),蛋白质水平使用液相色谱和串联质谱法检测,并在编码燕麦蛋白的基因中鉴定出了非活性基因和假基因(图3b,c)。

 

此外,作者将先前报道的乳糜泻疾病相关的T细胞表位(抗原决定基)定位到预测的燕麦蛋白上,并将其与小麦和大麦谷蛋白的T细胞表位模式进行了比较。结果显示,与小麦或大麦中发现的高发生率相比,只有一部分编码的燕麦蛋白含有乳糜泻相关的免疫反应区(图3b)。综合来看,燕麦中编码乳糜泻表位的基因拷贝数低、蛋白质序列中检测到的T细胞表位频率低、其他高免疫原性蛋白质的出现率低等,均支持将燕麦被纳入无麸质饮食中。

 

6、 一个蜡质突变体的单基因定位

为了证明参考基因组是如何使其他群体等资源得到更多的利用,该研究展示了表皮蜡(表皮蜡在燕麦抗生物和非生物胁迫中发会重要作用)突变体glossy.1的表型图(图4a, b)。该研究鉴定了突变体特有的纯合子多态性,并定位于1C染色体(图4c)。

 

图片

图4 一个表皮蜡质突变体的单基因定位

 

在燕麦染色体1C、2C和3A以及野生燕麦种上鉴定到与大麦Cer-cqu cluster同源的基因簇(图4h),大麦Cer-q突变体缺乏β-diketone和蜡质小管(图4e-g),包含候选基因的scaffold被定位于1C染色体区域(图4c)。进一步分析发现,AVESA.00010b.r2.UnG1403470是燕麦中的Cer-q基因。因此,参考基因组推进了燕麦中β-diketone生物合成研究,并帮助育种家培育出适应于未来炎热气候的燕麦品种。

 

总结

该研究组装的六倍体燕麦参考基因组为燕麦育种和基础燕麦生物学的进展,以及正在进行的泛基因组计划奠定基础。本文从分子水平挖掘了众多有关燕麦的特殊性质,如燕麦中麸质蛋白含量非常少,可以减少麸质蛋白引起的过敏和乳糜泻等相关症状,同时燕麦还含有更高比例的β-葡聚糖,这些结果是燕麦可作为无麸质食物的证据。

 

利用参考基因组来定位与农艺和人类营养相关性状相关的基因,将已知的数量性状位点锚定在‘Sang’参考基因组上,并且利用转录组图谱共表达网络来鉴定特定数量性状位点附近的候选基因。六倍体燕麦基因组的发布,提高我们对燕麦基本生物学的理解,并加速基因组学辅助燕麦育种进程。

 

参考文献:

Kamal N, et al. The mosaic oat genome gives insights into a uniquely healthy cereal crop. Nature. 2022.


Copyright © 2018 武汉贝纳科技有限公司 . All Rights Reserved. Designed by 鄂ICP备2021008976号-2技术支持:中网维优