喜报 | Pore-c最新实测进展,显示巨大潜力,解决基因组组装掐脖子问题
2024年,我们在pore-c的研究过程中发现,pore-c对T2T着丝粒、rDNA等高重复区域的挂载和组装具有突破性的意义,文章可见:T2T 基因组2.0 — 基因组组装到达终点了吗?随后,我们提出了如何进行Pore-c数据的正确评估,文章可见:Pore-C数据评估新方法与新指标:揭开多维基因组互作的奥秘
2025年开年,我们又在Pore-c的研究中发现了新得潜力:
(1)解决了HIC在重复序列区域挂载问题,互作空白区消失啦!
(2)纠正了HIC在同源多倍体分型中的错误挂载,实现了分型基因组的准确组装
(3)有效降低数据量,缩短组装时间和互作图调整难度!
Pore-c / HIC实测对比
1. Pore-C不进行唯一比对,及Unique序列的筛选,对重复序列区域的准确挂载非常友好!
实测案例一:结果显示,对于某基因组,包含高重复区域的染色体(chr4\chr13),HIC(100X)挂载结果会出现重复区域或互作信号较弱或没有互作信号的情况(通常我们见到的互作热图空白区);而相比之下,Pore-c(20X)挂载在高重复区域显示出前所未有的互作信号的高连续性,对于重复序列挂载及互作调控具有积极的指导意义!
相同基因组HIC(100X)与Pore-c(20X)挂载的实测比较
实测案例二:着丝粒区域多contig挂载不再是难题!该结果显示,当着丝粒区域由于序列高重复出现组装contig短且碎的情况时,HIC由于互作区域空白不能给组装准确的指示信号,但是Pore-C在该位置互作信号充足,有效指导了短小contig的挂载!
基因组着丝粒区域HIC和Pore-c挂载的实测效果比较
(左图为HIC(100X)挂载效果,右图为Pore-c(20X)挂载效果)
2. Pore-C有助于准确进行单倍型分型,纠正可能由重复序列引起的挂载错误
实测结果显示:左图为多倍体HIC(100X)挂载结果,从挂载结果中很难看出挂载异常;当使用Pore-c(20X)去验证这一结果时,我们发现HIC的多倍体的同源染色体挂载存在易位的错误(中间图,蓝色箭头,黄色方框区域);使用Pore-c(20X)挂载基因组,并调整错误区域,互作热图呈现较好的互作关系(右图)
3. Pore-C挂载时间短,有效缩短项目周期
实测显示:由于pore-c挂载使用数据量较少,Pore-c基因组挂载时间可以缩短到HIC挂载基因组时间的一半,有效缩短基因组项目周期。
Pore-c基因组组装策略
鉴于以上Pore-c在重复序列挂载中的突破性进展,我们特别提出新一代的基因组挂载方案:
高级T2T版本:HIFI(2n*50X)+ONT超长(2n*40X)+Pore-C(2n*20X)