您好,欢迎光临武汉贝纳科技有限公司
027-62435310 | service@benagen.com | 中文 | English 咨询客服
您现在的位置:主页 > 市场与支持 > 文献解读 >

染色质可及性数据助力基因型推断:遗传调控机制的新探索

image.png

英文标题:Genotype inference from aggregated chromatin accessibility data reveals genetic regulatory mechanisms

发表时间:2025.03.30

发表期刊:Genome Biology

影响因子:10.1


近期,宾夕法尼亚大学 Christopher D. Brown 团队与约翰霍普金斯大学 Alexis Battle 课题组联合开发了一种新型分析框架,通过挖掘万余例公共 ATAC-seq 样本数据,首次实现了从染色质可及性测序结果中同步推断基因型及定位 caQTL(染色质可及性数量性状位点)。该工作系统揭示了遗传变异通过动态调控染色质开放状态介导基因表达与复杂表型的分子路径,为GWAS信号的功能注释和机制解析建立了多维度的遗传调控图谱。


研究背景


全基因组关联分析(GWAS)作为解析遗传变异与表型关联的基础工具,揭示了基因组多态性对复杂性状的贡献;而表达数量性状位点(eQTL)则通过调控基因表达水平,为基因型到表型的转化提供了分子层面的解释。尽管如此,绝大多数 eQTL 变异与 GWAS 变异一样,位于非编码区域。因此,遗传变异如何精确调控基因表达进而影响表型性状的分子机制仍存在关键缺口。目前,一些研究提出了转录因子等与非编码区顺式调控元件相结合,进而调控特定基因表达的机制,以及顺式作用元件染色质可及性对该机制的影响,强化了“基因型-染色质状态-基因表达-表型多样性”的关联性,但该观点仍需要更多的证据支持。此外,目前缺乏与染色质状态直接对应的组织特异性基因型信息,影响了在特定组织和细胞状态下,对于遗传突变如何影响染色质状态进而调控基因表达这一问题的挖掘。


研究路线
image.png

主要结论

1. ATAC-seq数据推断基因型

研究团队系统整合了公共数据库(GEO)中653项研究的10,293例ATAC-seq样本数据,涵盖多组织来源、细胞类型及病理生理状态。通过评估多种基因型推断算法,发现基于连锁不平衡优化的Gencove模型在低深度测序适应性(覆盖度低至0.04x)及片段长度兼容性(长短片段imputation精度)上均显著优于其他方案。基于此,研究者成功构建了1,454例非冗余供体队列(避免QTL分析中的样本重复),并进一步优化ATAC-seq数据预处理流程,包括技术特异性噪声校正与跨研究批次效应校正。

image.png

图1 研究概述和样本特征


2. 遗传变异对基因表达的调控机制

基于整合的基因型数据与标准化ATAC-seq分析,研究团队系统性识别出24,159个显著caQTL位点。机制解析表明,这些位点显著富集于顺式调控元件(如启动子、增强子)及转录因子结合区域,提示其通过动态调控TF结合能力驱动染色质开放状态改变。进一步分析显示,基于组织来源分类的caQTL中,约36%具有组织特异性调控效应,印证了遗传变异对染色质可及性的调控高度依赖于组织微环境。

image.png

图2 染色质可及性峰和 caQTL 变异的特征


3. 共定位分析

为验证caQTL能否作为连接GWAS与基因表达调控的关键桥梁,研究团队通过共定位分析发现,caQTL与eQTL共享13%的最强信号位点。此外,同时加入caQTL和eQTL分析,发现GWAS的可解释率比单纯加入eQTL高28%,提示“SNP-caQTL-eQTL-traits”的全关联性证据链,对于深入挖掘GWAS的机制更有利。

image.png


图3 caQTL 映射到 GWAS 和 eQTL 变异标记的区域



研究小结


该工作不仅构建了综合性的caQTL数据资源库,更验证了多组学整合策略在解码复杂性状遗传调控网络中的关键价值。随着单细胞多组学与时空分辨率技术的迭代,未来的研究有望在细胞亚群等水平,揭示遗传变异对染色质动态的精准调控机制。


参考文献:

Wenz BM, et al. Genotype inference from aggregated chromatin accessibility data reveals genetic regulatory mechanisms. Genome Biol. 2025.

Copyright © 2018 武汉贝纳科技有限公司 . All Rights Reserved. 鄂ICP备2021008976号-2