文章标题:Microbial Keystone Taxa Identification in Global Wastewater Treatment Plants Based on Deep Learning
中文标题:基于深度学习识别全球污水处理厂活性污泥群落中的基石物种
第一作者:王森
通讯作者:王灿 (wangcan@tju.edu.cn)
通讯单位:天津大学
原文链接:https://pubs.acs.org/doi/10.1021/acs.estlett.5c00208
DOI:10.1021/acs.estlett.5c00208
微生物在维持活性污泥(AS)生态系统的稳定性方面发挥着至关重要的作用。近期研究表明,某些基石物种会对群落组成和功能产生影响,且这种影响与其丰度无关。然而,目前仍然缺乏一种能从海量高通量测序数据中识别这些基石物种的有效框架,尤其是在不进行复杂的微生物关联网络重建的情况下。在此作者引入了一个深度学习算法,该算法可以跨样本量化微生物的影响值,从而无需进行网络重建。这一算法有效避免了不同样本中物种基石程度存在差异这一棘手问题,使其适用于来自不同环境和气候条件的活性污泥群落样本。在这项研究中,作者将该算法应用于全球污水处理样本的高通量测序数据,识别了污水处理过程中的候选基石物种。在后续分析中作者发现温度和溶解氧是影响这些基石物种的主要因素。此外还发现基石物种与其他群落成员之间连接性的增强促进了活性污泥微生物群落间更紧密的互作。
基石物种的概念及其生态学意义
基石物种(Keystone Taxa)是指在生态系统中对维持群落结构和功能具有不成比例重要影响的物种。尽管它们的相对丰度可能很低,但其存在与否会显著影响整个生态系统的稳定性、多样性和功能。这一概念用于描述某些物种在生态系统中的关键作用。具体而言,在微生物生态学中基石物种通过以下方式发挥作用:
1)维持群落稳定性:它们作为“桥梁”连接不同功能群,促进资源流动和信息传递。
2)驱动或促进元素循环:例如,在污水处理厂中,某些基石物种直接参与氮、硫等关键元素的转化。不仅如此,基石物种还可以合成群落公共物质供其它物种使用。
传统基石物种识别方法的局限性
传统的识别基石物种的方法主要依赖以下两种策略:
1)网络中心性分析:通过构建微生物共现网络,计算节点中心性(如度中心性、介数中心性)来识别关键物种。但该方法需要大量样本,通常样本数需大于物种数的平方,易受虚假相关性干扰。此外,传统的网络构建方法忽略了群落特异性,即同一物种在不同样本中的重要性可能不同,从而增加遗漏真实基石物种的风险。
2)实验扰动分析法:通过人为移除特定物种观察群落变化。然而这种大规模的扰动实验在复杂且庞大的生态系统中难以实施。
本工作中深度学习算法的创新与优势
基于前人的研究,本文引入了一种深度学习算法,通过量化物种的“基石性”(Keystoneness)来规避传统方法的局限性。其核心优势包括:1)无需网络重建:直接学习微生物存在矩阵与丰度矩阵的映射关系,样本量小于物种量所造成的高维相关性网络的假阳性风险。2)解决群落特异性问题:通过逐样本计算物种移除对群落的扰动效应,捕捉同一物种在不同环境中的基石性数值。3)高效性与可扩展性:适用于不同跨地点的样本数据,计算效率显著高于传统网络方法。
内容亮点:
该深度学习算法避免了网络构建中的假阳性风险。
揭示溶解氧和温度是调控基石物种分布的核心环境因子。
发现基石物种是通过增强微生物互作来塑造群落。
1. 数据转换与矩阵构建
将原始的微生物丰度数据(属水平)转换为二进制的存在矩阵(Presence Matrix)
同时保留原始的丰度矩阵(Abundance Matrix),作为深度学习模型的训练目标。
2. 深度学习模型训练
模型通过训练能够根据微生物物种的存在/缺失状态预测其相对丰度分布。
3. 扰动实验与基石性计算
逐一去除每个微生物物种:在存在矩阵中依次移除单个物种,生成新的扰动后存在矩阵。
预测扰动后的丰度:将扰动后的存在矩阵输入模型,预测对应的丰度分布。
量化基石性(Keystoneness):通过比较扰动前后的丰度差异评估每个物种对群落结构的影响。差异越大,表明该物种的基石性越高。
4. 基石物种筛选
根据不同处理工艺分组样本,每组中筛选基石性值(keystoneness)最高的前20个物种作为候选基石物种。
合并各组结果并去重,最终确定全局污水处理系统中的基石微生物物种列表。
图2 全球污水处理厂中的基石物种分布
1. 基石物种的识别与分布:对至少存在于 20% 样本中的物种计算基石度并按中值排名,筛选出每种处理类型(好氧和有氧 - 厌氧交替)中基石度最高的前 20 个物种。好氧和有氧 - 厌氧交替组的基石物种分布明显不同,前者模式独特多样,后者物种相似度高。同一物种在不同样本中基石度不同,而基石度最低的 60 个物种无显著变化和群落特异性。
2. 基石物种的丰度与分类:基石物种相对丰度大多极低,部分如 Arcobacter 等平均丰度高但样本间差异大,且被确定为污水处理厂的核心细菌。系统发育树显示基石物种主要集中在变形菌门(Proteobacteria)、拟杆菌门(Bacteroidetes)、放线菌门(Actinobacteria)和厚壁菌门(Firmicutes),不同处理过程中基石物种相对丰度的门水平模式相似,以变形菌门和拟杆菌门为主。
3. 基石物种与元素循环:部分基石物种与污水处理厂中的基石元素循环密切相关,如 Desulfurispora 等参与硫循环,Nitrosococcus 和 Polaromonas 分别参与氮循环中的氨氧化和反硝化过程,此外FAPROTAX 功能预测表明基石物种还参与能量获取和营养循环等过程,以帮助群落维持稳定性。
4. 基石物种的生态桥梁功能:许多基石物种充当生态桥梁,通过介导种间相互作用增强微生物群落稳定性,如 Fibrobacter 和 Eubacterium 降解纤维素提供碳源,Janthinobacterium 产生群体感应代谢物促进生物膜形成,Rhodococcus 合成铁载体促进硝化和反硝化细菌获取铁以支持氮转化。 强调了研究这些看似“默默无闻”的微生物成员的重要性,因为它们的生态作用不仅限于污水厂中主要元素循环,它们有着更广泛的生态功能(例如维持生态系统的稳定性和耐冲击性)。
图3 基石物种的影响因素及其在生态网络中的作用
1. 外部条件对基石物种的影响:不同曝气条件显著影响基石物种的分布,通过 β 多样性和 α 多样性分析发现,溶解氧(DO)和温度(Temp)是显著影响基石物种群落的环境因素,且温度对整个微生物群落影响最大。主坐标分析(PCoA)中所有因素解释的总方差百分比有限,表明基石物种呈连续分布,不同样本在基石物种群落上有一定相似性,同时其他环境因素如污泥停留时间和 pH 的影响程度低于 DO 和温度。
2. 微生物生态系统稳定性的维持机制:构建偏最小二乘路径模型(PLS-PM)研究环境与微生物关系,结果显示温度对基石物种影响最大(路径系数 =-0.390,p < 0.001),DO 影响基石物种丰度(路径系数 = 0.131,p = 0.007),温度与基石物种呈负相关可能是因为温度上升导致基石物种主要组成部分(如变形菌门、酸杆菌门和拟杆菌门)相对丰度降低。基石物种对群落稳定性有显著贡献(路径系数 = 0.703,p < 0.001)。PLS-PM 模型未发现 DO、温度、基石物种与群落多样性之间的显著线性关系,但可能存在非线性相关。群落凝聚力与群落多样性呈正相关(路径系数 = 0.565,p = 0.004),DO 和温度通过影响基石物种表达,进而影响群落凝聚力,间接影响群落结构。
3. 微生物相关性网络:对包括基石物种和其他物种的微生物相关性网络分析表明,实证网络的平均聚类系数和模块化程度显著高于随机网络,说明节点关联非随机。不同 DO 范围的共现网络分析显示,高 DO 条件下微生物网络更复杂多样,如 DO 在 15-20 mg/L 范围内,微生物相互作用更复杂丰富,基石物种节点优势明显,连接广泛。在某些温度组(如 10-15°C),网络模块化程度低但平均聚类系数高,也是由于基石物种的促进作用。研究表明,许多基石物种属于 “基石模块”,推测基石度高的物种会强烈影响相邻物种从而形成基石模块,未来研究应全面识别这些基石模块,以更好地理解群落动态和生态原理。
本研究利用全球污水处理厂样本识别了污水处理中的基石物种,并揭示了在污水处理生态系统中基石物种作为 “桥梁” 促进微生物协同互作、维持群落稳定的重要作用,为优化污水处理过程、增强系统韧性提供了理论依据,但目前外部环境因素与基石物种的具体定量关系不明,深度学习方法在应用中也存在诸多局限。未来研究需着力探索两者间定量关系,克服深度学习应用难题,并借助功能基因预测和代谢途径分析,深入研究基石物种对其他微生物代谢与生态功能的影响,以此提升基石物种识别的可靠性与适用性,推动其在污水处理系统优化中的实际应用。