基于重测序的群体进化
群体进化分析通过全基因组重测序数据,解析物种的遗传结构、进化历程及适应性变化,为理解群体遗传多样性及其进化机制提供重要依据。通过主成分分析(PCA)、系统发育树和群体结构分析,可示种群间的亲缘关系、分化模式以及基因交流(gene flow)情况,进一步解析迁移历史及环境适应性特征。同时,选择清除(selective sweep)分析可识别受自然选择或人工选择作用的基因组区域,揭示影响驯化和环境适应的关键基因。此外,基因交流研究可评估不同种群间的遗传渗透,追踪杂交、迁移及基因流动的动态变化。
此外,借助长读长测序技术,研究人员能够更精确地解析大规模结构变异(SV)对群体进化的影响,克服短读长测序在检测复杂变异时的局限性,从而提供更全面的遗传证据。这些深入的群体进化研究不仅有助于揭示物种适应性进化的遗传机制,也能为生物多样性保护、驯化过程解析及遗传资源利用提供重要科学依据。
技术路线

推荐策略
1. 二代测序(NGS)≥10X/个体
2. 代表性个体三代测序≥30X/个体
3. 适用范围
具备高质量的参考基因组序列
选取同一物种的不同亚种或品系的自然群体,以确保群体遗传多样性的代表性
选取地理分布不同、群体划分明确的亚群,确保同一亚群内个体具有代表性,便于解析种群结构
建议每个亚群至少包含10个样本,总体不少于30个样本,以确保足够的统计支持,尽可能反映群体的遗传多样性
研究应包含至少两个亚群,以便有效对比种群差异
-
Q1. 什么是群体进化分析(Population Genomics / Evolution Analysis)?
群体进化分析是通过比较不同群体或物种的基因组差异,研究其遗传多样性、分化程度、自然选择与群体历史演化的过程。
基于重测序(re-sequencing)数据,可在全基因组尺度上检测突变、选择与遗传漂变信号,从而揭示动植物的适应性进化机制和驯化历史。
Q2. 基于重测序的群体进化研究通常需要多少样本?
样本量取决于研究目标:
· 群体多样性与分化分析:每群体建议 ≥ 20 个个体;
· 选择扫描与驯化分析:每群体 ≥ 30 个个体更具统计功效;
· 群体历史重建(PSMC/SMC++):通常使用高深度(≥20×)的代表性样本。
在预算允许的情况下,建议覆盖多个地理群体或生态型以增强信号检测能力。
Q3. 群体进化分析可以回答哪些科学问题?
· 动植物在不同生态环境下的适应性分化机制;
· 驯化事件与栽培种起源;
· 杂交、基因渗入与基因流过程;
· 种群历史变化与瓶颈事件;
· 与性状进化相关的基因或调控元件识别。
Q4. 群体进化分析结果如何与功能研究结合?
群体进化结果可与转录组(RNA-seq)、表观组(甲基化组)或泛基因组结构变异数据结合,验证候选基因的功能意义。例如:
· 在选择信号区识别差异表达基因;
· 结合结构变异揭示基因缺失/拷贝数变化的适应意义;
· 通过功能注释或基因编辑验证关键基因的作用。
Q5. 使用高质量参考基因组(如T2T或单倍型组装)对群体进化研究有什么优势?
高质量参考基因组能:
· 显著减少比对偏差,提高SNP检测准确性;
· 保留端粒、着丝粒等复杂区域的变异信息;
· 支持结构变异和重复序列相关的进化研究;
· 使群体比较更接近真实的基因组变异情况。
Q6. 群体进化分析与 GWAS 或 QTL 定位有什么联系?
群体进化分析揭示自然选择与群体分化,而 GWAS/QTL 则直接关联表型。
两者结合可以:
· 将自然选择信号与表型关联位点交叉验证;
· 辅助筛选真正参与性状适应或驯化的功能基因;
构建从基因型–表型–进化压力的整合性研究框架。
-
案例分享
基于绵羊T2T参考基因组结合SV与群体选择分析--挖掘与羊毛细度相关的变异(Nat Genet, lF=31.7)
一、文章题目:
Telomere-to-telomere sheep genome assembly identifies variants associated with wool fineness
二、研究亮点:
1. 采用长读长测序构建高质量 T2T 基因组(含X、Y性染色体)解析复杂重复区域和结构变异。
2. 解析群体基因组结构,揭示不同进化分支的遗传分化模式。
3. 识别全基因组范围内的选择信号,解析关键环境适应性变异。
4. 发现大规模结构变异(SV),揭示其在群体进化中的作用。
5. 结合 SV 与选择分析,挖掘重要功能基因,助力进化与育种研究。
三、主要研究结果
本研究完成了绵羊端粒到端粒(T2T)基因组的高质量组装,填补了当前绵羊参考基因组的空白区域,并对关键基因组特征进行了深入解析。研究团队基于ONT、PacBio HiFi长读长测序、Bionano光学图谱及Hi-C数据,成功构建了湖羊(HU3095)的T2T基因组(T2T-sheep1.0),总长2.85 Gb,相较于Ramb v3.0,解析了220.05 Mb的新区域,并首次组装出完整的Y染色体(T2T-sheep1.0-chrY)及着丝粒区域。进一步分析揭示了绵羊着丝粒主要组成,并探究了绵羊中着丝粒结构的进化模式。
本研究还基于18只已发布的羊PacBio三代测序数据,检测到192,265个结构变异(SV),其中16,885个位于未解析区域(PURS),部分与湖羊的繁殖和毛囊发育相关。同时,基于738只家养绵羊和72只野羊的重测序数据进行群体遗传学分析,结果表明T2T-sheep1.0参考基因组的比对率更高,错误率更低,并能更准确地反映绵羊的群体进化历史。
此外,通过比较家养与野生绵羊的基因组数据,研究鉴定了驯化过程中受选择的基因组区域,并发现了多个新选择信号,进一步解析了与羊毛细度相关的TARBP1、EPS8、DMXL2基因,以及与毛发生长相关的RSPO3、OFCC1基因.本研究首次完成了绵羊T2T基因组的高精度组装,并在结构变异、群体遗传学、性染色体进化及毛用性状遗传机制等方面提供了重要的新见解。

参考文献
Luo LY, et al. Telomere-to-telomere sheep genome assembly identifies variants associated with wool fineness, Nat Genet. 2025
-
