基于重测序的GWAS
全基因组关联分析(Genome-wide association study,GWAS)基于全基因组重测序技术,通过对自然群体或核心种质资源中的个体进行基因组测序,并结合目标性状的表型数据,利用统计模型分析基因型与表型之间的关联,精准挖掘控制目标性状的关键基因或染色体区段。GWAS无需构建特定的群体,能够高效解析复杂性状的遗传基础,特别适用于多基因控制性状的研究。该方法因其“遗传背景丰富、变异检测全面、适用性广泛”的优势,已广泛应用于作物改良、动物育种及人类疾病研究。
一、技术路线

二、推荐策略
1. 测序深度:>15X/个
2. 群体样本数>200个
3. 适用范围:
·具备高质量的参考基因组
·遗传变异和表型变异丰富(种质资源库、自然群体、农家种)
·群体结构分化不能过于明显(如亚种以上,无明显生殖隔离)
·表型要稳定(多年多点进行性状观察,遗传力较强)
·染色体倍性要一致
-
Q1. 什么是基于重测序的 GWAS?
全基因组关联分析(Genome-Wide Association Study, GWAS)是一种通过分析群体中基因型与表型的关联关系,以识别与复杂性状相关基因或变异位点的方法。
当 GWAS 基于重测序数据进行时,可直接利用高密度 SNP 和SV信息,显著提高定位精度和候选基因解析能力。
Q2. 基于重测序的 GWAS 相较于芯片型 GWAS 有什么优势?
· 更高的分辨率:重测序可检测全基因组范围内的所有变异,而芯片受探针设计限制。
· 跨物种或新物种可用:无需依赖已知芯片资源,适用于非模式或野生种群。
· 捕获稀有变异:尤其在调控区或结构变异区域,重测序能识别更多功能性突变。
· 可同时进行群体遗传结构与变异功能注释分析。
Q3. 通常需要多少样本才能进行 GWAS?
样本量决定统计功效。一般建议:
· 植物群体:不少于 100–200 株;
· 动物群体:不少于 300 个个体;
· 对复杂性状或多基因控制性状,样本量越大越好(>500 更优)。
此外,样本的表型差异显著性和测序深度(通常≥15×)也非常关键。
Q4. 表型数据对 GWAS 有多重要?
极其关键。高质量、可重复的表型测定是 GWAS 成功的前提。
建议:
· 表型测量至少在两个环境或重复中进行;
· 对数值性状可进行标准化或BLUP校正;
· 对定性状(如颜色、抗性等级)要确保分类标准统一。
Q5. GWAS 能找到真正的功能基因吗?
GWAS 能识别与目标性状显著关联的基因组区段或候选基因,但因连锁不平衡(LD)存在,通常仍需进一步验证。
常见的验证方式包括:
· 精细定位与基因克隆;
· 表达分析(RNA-seq)与变异功能预测;
· 基因编辑或转化实验(如CRISPR验证)。
Q6. 如何提高 GWAS 的定位准确度?
可通过以下策略优化:
· 使用高质量参考基因组(尤其是 T2T 或单倍型组装);
· 提高测序深度和变异过滤标准;
· 采用混合线性模型(MLM)或多模型融合减少假阳性;
· 结合泛基因组或结构变异信息分析复杂性状。
Q7. GWAS 可与哪些分析结合以增强结果解释力?
· QTL定位:验证群体内关联信号;
· 转录组(RNA-seq):探索候选基因表达差异;
· 表观组或甲基化组:分析调控层次;
· 泛基因组分析:识别因基因缺失/存在变异导致的性状差异。
-
案例分享
葡萄单倍型T2T泛基因组构建及SNP/SV-GWAS分析--推动性状遗传研究与基因组育种 (Nat Genet,lF=31.7)
一、文章题目
Grapevine pangenome facilitates trait genetics and genomic breeding
二、研究亮点
1. 组装9个T2T单倍型基因组(18个assemblies),并结合11个已发表基因组,构建葡萄图形泛基因组Grapepan v1.0。
2. 基于466份葡萄种质的全基因组变异分析,构建变异图谱,揭示酿酒葡萄与鲜食葡萄的遗传关系及SVs的非均匀分布模式。
3. 基于SV-GWAS分析,解析324份葡萄品种29种农艺性状的遗传基础,鉴定148个显著关联位点,其中12个位点受SVs显著影响。
4. 通过XP-EHH分析,发现酿酒葡萄与鲜食葡萄在果皮涩味、果实形状、果肉硬度等性状上的显著分化,并鉴定多个与果实大小和代谢物含量相关的GWAS候选位点。
5. 评估SVs对农艺性状的遗传力贡献,发现SVs可解释浆果宽度74.6%的遗传变异,而SNPS仅解释0.5%,表明SVs在葡萄育种中的重要作用。
三、主要研究结果
本研究构建了高质量的葡萄图形泛基因组Grapepan v1.0,解析了葡萄的遗传变异和群体结构。基于466份葡萄种质重测序数据,研究者构建了包含8,591,818个SNPS、513,969个inDels和236,449个SVs的变异图谱,并对群体结构和连锁不平衡进行了深入分析。
在全基因组关联分析(GWAS)中,研究者结合SNP-GWAS和SV-GWAS,共鉴定出148个与29种农艺性状显著相关的遗传位点,其中136个SNPS和12个SV,覆盖基因组约5.58%的区域。候选区域与浆果大小、果皮厚度、果肉硬度、可溶性固形物含量等重要性状相关,并部分与已知功能位点重叠。值得注意的是,研究发现SNPS和SV在GWAS结果中呈现不同的作用模式,例如,SV-GWAS发现的候选基因区域SSC7和BeWi9与可溶性固形物含量和浆果宽度相关并表现出选择性清除特征。此外,在该区域发现NEPS和NRT1两个基因家族,与葡萄品质相关基因的表达模式相吻合。进一步的XP-EHH选择性扫描识别出酿酒葡萄和鲜食葡萄之间的显著分化区域,总计约 21.45 Mb,富集到多个影响果实大小、果皮涩味、酒石酸含量等关键性状的候选位点。
此外,研究还发现SVs对农艺性状遗传力的贡献显著高于SNPS,例如SVs解释了浆果宽度(BeWi)74.6%的遗传力,而SNPS仅解释0.5%;在可溶性固形物含量(SSC)方面,SVs贡献35.8%,SNPS仅贡献0.6%。这些结果表明,SVs在葡萄性状形成中的作用被低估,其纳入可极大提高葡萄育种中遗传力的估算精度。
本研究所构建的泛基因组、变异图谱、GWAS 候选基因区域及选择信号分析结果,为葡萄性状解析和分子育种提供了新的遗传资源和精准的分子标记。


参考文献
Liu Z, et al. Grapevine pangenome facilitates trait genetics and genomic breeding. Nat Genet. 2024.
-

