T2T单倍型(Haplotype-resolved T2T)基因组——开启精准育种新时代专题(二)
当前常用的基因组组装方法忽略了同源染色体之间的差异,组装结果是混杂了来自双亲同源染色体的嵌合序列。
针对特殊二倍体(杂交种、基因组杂合度高等物种)以及多倍体物种,可以通过对此类物种进行单倍型基因组组装,获得来自父、母本分别的遗传信息,进行亚基因组不对称演化研究,挖掘单倍型等位基因间的表达差异,以更好的进行后续重测序、性状定位、进化、基因功能、基因编辑等研究。
为满足广大学者的科研需求,贝纳基因推出“单倍型T2T基因组(Haplotype-resolved T2T genome)”全套解决方案。
1.Haplotype-resolved T2T genome测序方案
2.Haplotype-resolved T2T genome分型组装方案
在Haplotype-resolved T2T genome组装过程中准确的分型是非常重要的,如何做到准确分型?如何鉴定分型的准确性?
贝纳基因以PacBio HiFi测序数据为基础,使用家系、Hi-C及Nanopore ultra-long进行辅助分型,借助HIC和kmer 聚类排除嵌合组装,完成物种单倍型基因组的准确拆分。
01 分型组装方法
-
家系(Trio binning)、Hi-C或Nanopore ultra-long辅助全局性分型
Hifiasm是针对HiFi数据开发的组装软件,在组装中Hifiasm能够尽可能的保留单倍型杂合信息,可以实现快速、准确的单倍型基因组组装。该组装算法通过额外的信息,如家系(Trio binning)、Hi-C或Nanopore ultra-long等数据,预先全局性的将待组装的测序读段划分到不同单倍型,再进行分别组装,从而获得高质量的单倍型组装结果。但是这种方法难以做到完美的预先划分,仍然可能存在嵌合组装。
-
两单倍型合并HIC排除嵌合组装
将全局性分型的两个单倍型结果合并进行HIC挂载,根据互作信号进行嵌合组装错误的判断,并调整错误组装。
-
Subphaser辅助排除嵌合组装
Subphaser可以在同源染色体间互作的基础上,根据特异kmer 聚类和PCA分析等,评估单倍型分型准确性,辅助嵌合组装调整。
Subphaser评估
-
技术路线
贝纳基因单倍型基因组分析技术路线示意图
02 分型组装评估
为评估基因组的分型组装准确性,组装完成需进行全面的组装质量评估(单倍型拆分准确性),包含subphaser验证、单倍型基因组分型准确性评估(switch error)、BUSCO完整性评估、单倍型基因组间共线性评估,通过灵活可调整的组装方式和完善的评估流程,进行单倍型基因组的研究。
贝纳基因单倍型基因组分型验证结果示例
3.Haplotype-resolved T2T genome高级分析方案
01 单倍型变异统计分析
尽管亚基因组间会存在非常明显的共线性,但是亚基因组间仍存在大量结构变异(SV)等。对组装出的亚基因组进行比较,鉴定亚基因组间存在的变异,并绘制共线比较图。
亚基因组全基因组水平 SV 变异结果示例
02 亚基因组Ka/Ks偏倚分析
在许多物种基因组中,亚基因组的显性通常会导致更强的纯化选择和同源基因的显性基因表达。为了评估亚基因组的选择压力,根据同源基因对计算了Ka和Ks值。通过比较不同亚基因组的Ka/Ks,进行亚基因组的不对称进化研究。若亚基因组A的Ka/Ks显著高于亚基因组B,则说明亚基因组A基因处于宽松的纯化选择,比亚基因组B的同源基因进化的更快,而亚基因组B经历更强的纯化选择。
亚基因组不同染色体的Ka/Ks结果示例
03 等位基因特异表达分析
等位基因特异表达(Allele-specific expression,ASE)指单倍型间来自于亲本的等位基因表达水平存在显著差异。在物种亚基因组间常存在ASE的情况,对亚基因组中等位基因的表达偏倚进行鉴定,区分优势亚基因组,是后续遗传育种、基因功能研究的必要前提。
亚基因组基因表达不对称分析统计
4.ONT超长助力Haplotype-resolved T2T genome 组装
贝纳基因专注于ONT超长(N50>150 kb)测序研发,独立研发的DNA抽提试剂盒Super-long DNA Isolation Mini Kit (3T) (Cat. No. ZY2203A01),对样本进行提取、建库,不切胶、不富集,直接测序产出超长片段。
贝纳基因最新动、植物ONT超长测序进展:
N50>150 kb单张芯片raw data可达24.01G;N50>200 kb raw data 高达9.13G。

贝纳基因动植物N50>150 kb产出展示
