Nat. Commun高分文献解读 | 青藏高原水生微生物的基因组及基因集
简介
本研究汇集来自青藏高原盐水湖、淡水湖、河流、温泉、湿地及冰川的498个水体样本进行宏基因组测序,建立了一个全面的青藏高原水生微生物组的基因组、基因目录——TPMC,这是高海拔水生微生物资源的重要资源库,展现出发现新的微生物谱系和功能的巨大潜力,还在一定程度上填补了微生物组生物地理学的领域空白。

英文标题:A genome and gene catalog of the aquatic microbiomes of the Tibetan Plateau
中文标题:青藏高原水生微生物的基因组及基因集
发表期刊:Nature Communications
影响因子:16.6
发表时间:2024年02月
技术路线

部分主要结果
1. 不同水生态系统的菌群组成和网络

图1 青藏高原水生菌群的组成和网络图
为了研究水生态系统中微生物群落,收集了青藏高原中部高原(简称西藏)和青藏高原东北边界(祁连山脉-青海湖,简称祁连)的498个宏基因组样本,涉及不同的水生态系统:咸水湖、淡水湖、河流、温泉、湿地和冰川(图1a)。PCoA分析发现淡水湖和咸水湖的菌群与其他4种生态系统有显著差异(图1b)。
用中性群落模型(NCM)对微生物组合进行了深入分析,大多数微生物群落与NCM模型的拟合度有限(R2<0.3),表明随机过程对菌群的贡献很小,突出了环境选择压力在塑造菌群组成方面的作用(图1c)。网络分析结果进一步揭示了菌群间不同的稳定性模式,西藏河流和淡水湖的脆弱性最高,祁连河流的脆弱性最低(图1d)。
2. TPMC提供了庞大的基因组资源

图2 TPMC中MAGs的环境和地理分布及其物种聚类
TPMC包含了32355个中高质量的MAGs(图1a),平均完整度达78.1%,平均污染度为2.6%(图1b)。进一步聚类为10723个菌种(图1c),其中9698个(90.44%)没有匹配到任一公共数据库(GTDB、GEM、TG2G、TARA),说明TPMC在很大程度上完善了现有的全球微生物组图谱。
研究发现绝大多数物种的MAG只在单一地区或水生态系统中得到(图1d-e),在湿地组装出来的MAG数量显著高于其他水生态系统。表明青藏高原湿地资源中的微生物基因组具有地区与水生系统特异性。
3. MAGs的进化树及其生物合成潜力

图3 MAGs的进化树及其生物合成潜力
对TPMC物种做分类注释发现其丰富的物种多样性,涵盖了83个已知门、186个已知纲、470个已知目、952个已知科、1835个已知属。进一步构建了TPMC的系统发生树,突出显示了前11个门(图2a)。有相当多的TPMC物种(n=9384,87.5%)仍未被注释到。
为评估TPMC生物合成基因簇的新颖性,将73864个BGCs聚类为18414个基因簇家族(GCF)和2681个基因簇类(GCC)。跟BiG-SLICE数据库比较,鉴定出10128个(55.0%)新GCFs和1471个(54.9%)新型GCCs,大多数BGC类型有超过50%的新GCFs或GCCs(图2b-c)。鉴定了11个富含BGCs的物种,至少能合成超过20个BGCs(图2d)。表明TPMC物种可能能产生多种独特结构和功能的次生代谢产物来适应恶劣的生存环境,有丰富的生物合成潜力,可以极大地扩展当前全球BGC资源。
4. 富含BGCs物种的生物合成潜力

图4 富含BGCs物种的生物合成潜力
两种富含BGC的MAG(在冰川中得到的Myxococcus caerfyrddinensis、Corallococcus sicarius)表现出产物NRPS的高生物合成能力。它们的某些BGC在其他水生态系统中也存在,甚至更为富集(图4b),如西藏的湿地和河流,以及祁连的河流。Myxococcus caerfyrddinensis中近一半的BGCs(n=38,47.5%)和Corallococcus sicarius中的BGCs(n=35,41.7%)是新的BGCs。
5. 中国“三阶梯地形”的微生物组生物地理学模式


图5中国“三阶梯地形”的微生物组生物地理学模式
TPMG的建立促进了从青藏高原到中国东海岸的微生物组生物地理的研究(图3a),包含来自阶梯2和阶梯3的淡水、河流、湿地的109个样本,结合青藏高原的498个样本,以青藏高原作为参考坐标展示了各阶梯间的差异。
在同一水生态系统中,随着距离增加、海拔差增加,样品间微生物相似性降低(图3b-c)。青藏高原最丰富的Pseudomonadota数量沿阶梯呈递减趋势,而Verrucomicrobia则呈增加趋势(图3d)。通过607个样本构建的非冗余基因集含329568659个基因,在功能层面上同一水生态系统内样品之间共享基因数量随地理距离、海拔差的增加而减少(图3e-f)。体现了微生物组生物地理学中潜在的扩散模式。
小结
TPMC中包含着32355个中高质量MAGs,将MAG进一步聚类得到10723个菌种,其中88%为未注释物种(新菌)。TPMC中包含近3亿个非冗余基因(15%为新基因),73864个生物合成基因簇(50%为新基因簇)。研究了青藏高原水生菌群在中国三级阶梯地形上的生物地理学,发现与青藏高原微生物组共有的菌群组成和共有基因数量随着距离和海拔的差异增大而下降。
TPMC是高海拔水生微生物资源的重要资源库,有发现新的微生物谱系和功能的巨大潜力,且填补了微生物组生物地理学的知识空白。
参考文献:
Cheng M Y, et al. A genome and gene catalog of the aquatic microbiomes of the Tibetan Plateau. Nature Communications. 2024.
原文链接:
https://www.nature.com/articles/s41467-024-45895-8