第一作者:王纬嘉 硕士(安徽大学资环学院)
第二作者:王飞 博士生 (合肥工业大学计算机与信息学院)
通讯作者:
徐春燕 副教授(安徽大学资环学院)、石先阳 教授(安徽大学资环学院)
王中桢 研究员(中科院合肥物质院安徽光机所、阿卜杜拉国王科技大学)
论文 DOI:
https://doi.org/10.1016/j.watres.2025.123994
近日,安徽大学资环学院徐春燕副教授、石先阳教授和中科院合肥物质院安徽光机所王中桢研究员等人在《Water Research》上发表了题为“Robust S3Former Deep Learning Model for the Direct Diagnosis and Prediction of Natural Organic Matter (NOM) from Three-Dimensional Excitation-Emission-Matrix (3D-EEM) Data”的研究论文(DOI: 10.1016/j.watres.2025.123994),基于Transformer模型与稀疏感知注意力机制, 引入了一种性能优化的深度学习S3Former 模型,基于三维荧光(3D-EEM)数据,实现水体中天然有机物(Natural Organic Matter, NOM)种类和浓度的直接诊断。该模型在更加复杂的环境下如膜过滤液(分子量改变)和复杂的真实水体条件下(如天然地表水、污水处理厂进水出水等),依然展现了极高的NOM种类识别准确度和较高的浓度识别准确度,印证了该S3Former模型的稳健性,对于水质的实时诊断和水处理过程如膜过程的实时监测具有重要意义。
本工作中,我们提出了一种融合稀疏空间谱感知的Transformer架构(S3Former),用于快速识别3D-EEM光谱数据。该模型聚焦3D-EEM光谱的空间特征,其稀疏注意力机制能够确保高效的内存和计算性能,降低前馈层的内存消耗,并有效准确地替代标准注意力机制,无需预训练修正。该方法适用于各种Transformer模型。
图文导读
总体架构

图1.提出的用于快速识别3D荧光光谱中NOM的S3Former的整体流程。
如图1所示,我们首先介绍所提出的S3Former架构的整体流程,该架构旨在基于NOM快速诊断3D-EEM光谱。接下来,我们描述了稀疏空间光谱感知的多头注意力机制,该机制针对3D-EEM荧光光谱的空间特征进行了定制。最后,我们详细介绍了模型中使用的随机噪声扰动和自适应学习率调整方案。
实验设计

图 2.基于深度神经网络 (DNN) 开发 NOM 直接3D-EEM 诊断方法的四步实验。
本研究主要包括四个步骤(图2):步骤1,溶液制备,选取4种NOM,配制并稀释至相应浓度,同时配制二元混合物;步骤2,数据采集,对获得的NOM样品进行荧光检测,获取相应的荧光数据;步骤3,数据分析,利用基于Python的数据处理算法对3D-EEM数据进行量化处理,并采用先进的深度神经网络(DNN)实现对NOM种类及其浓度的快速准确识别;步骤4,实际应用,以膜过滤实验的渗透液作为测试样品,应用该模型分析其荧光数据,确定NOM种类及浓度范围。
预测精度与模型对比

图 3. (A) S3Former 模型对一元 NOM 物种、二元 NOM 物种、一元 NOM 浓度和二元NOM 浓度数据集的预测准确率。(B) 一元和二元 NOM 的气泡图。
如图3所示,S3Former 在多个维度上表现良好。由于其稀疏空间光谱感知注意机制和多级、多尺度特征提取架构,它有效地平衡了准确率和推理时间,同时保持了较低的模型复杂度。推理时间的减少使 S3Former 能够在实际应用中更快地处理大量光谱数据,提供及时的分析结果。图4展示了预测精度。我们的 S3Former 模型出色地诊断了采样的一元和二元 NOM 种类(分别为 100% 和 97.2%)及其浓度(分别为 75% 和 65.6%)。

图 4. S3Former用于一元和二元 NOM 的混淆矩阵。混淆矩阵按特定顺序在行和列中列出物种,列上是预测值,行上是真实值。正确的预测位于矩阵的对角线上。
模型应用

图5. 膜过滤实验示意图及实验结果和S3Former模型验证。膜出水污染物浓度值与S3Former模型预测区间对应。绿点表示预测区间正确,红点表示预测区间不正确,蓝点表示预测区间与实际浓度误差小于1mg/L。
我们设计并进行了一系列 NOM 过滤实验, 使用荧光光谱分析 UF 渗透液。然后使用 Swin-Transformer 和 S3Former 模型分析结果,并使用动态筛选机制识别样品。选择 HA 和 BSA 作为实验的模型污染物。分别以浓度为 1000 ppm 和 100 ppm 的 HA 和 BSA 溶液作为进料。过滤实验中使用截留分子量 (MWCO) 为 0.22 µm(用于HA 过滤)和 10 kDa(用于 BSA 过滤)的聚醚砜 (PES) 膜。实验结果表明,0.22 µm PES
膜对 HA 表现出优异的截留率(稳态截留率 > 97%)。在检测范围内,S3Former 模型对 HA 浓度的识别准确率最高约为 76.9%。10 kDa PES 膜对BSA 表现出良好的截留率(稳态截留率 > 90%),尽管截留率有所波动,但 S3Former 模型对 BSA 浓度的识别仍然比较准确,最高准确率可达 76.9%。相比之下,Swin-Transformer 模型对 HA 浓度的识别准确率最高约为 61.5%,对 BSA 浓度的识别准确率最高约为 53.9%。结果表明,在复杂水样条件下,S3Former 在适用性和稳定性方面优于Swin-Transformer 。
为了进一步评估 S3Former 模型的适用性和稳健性,采集了真实水样,并量化了其实际天然有机物(NOM) 含量和浓度,然后与模型的预测输出进行了比较。采样在多个地点进行:中国合肥市市政污水处理厂(WWTP) 塘溪河水再生厂(样品 1-2);同一 WWTP 内的膜生物反应器 (MBR) 装置(样品 3-4);以及从中国最大的淡水湖之一巢湖(中国安徽省合肥市巢湖湖滨国家湿地公园)采集的10个代表性地下水样品(样品 11-20)。然后,我们应用 S3Former 模型来识别主要的 NOM 类型及其浓度范围。结果表明,S3Former 在诊断两种主要 NOM 类型方面表现良好(准确率为 95%)。在来自 WWTP 和 MBR及其 UF 渗透物的 10 个样本中,S3Former 对浓度范围识别的准确率为 90%(包括被识别为 HC 的 10 mg/L 以上的浓度)。作者简介

徐春燕:博士,副教授、硕士生导师,现任职于安徽大学资源与环境工程学院,博士毕业于美国佐治亚理工学院,博后工作于美国德克萨斯大学奥斯汀分校,长期从事水处理方面研究,北美华人环境工程与科学教授学会(CAPEES)成员,环境领域权威SCI期刊《Environmental Science and Technology》审稿人。主要研究方向为水处理、纳滤膜技术以及电渗析技术。在Environmental Science & Technology,Water Research,Journal of Membrane Science,Environmental Science: Nano等期刊上发表SCI论文二十余篇。主持安徽省自然科学基金青年基金、安徽省高校科研项目(自然科学类)等

王中桢:博士,研究员,现就职于中科院合肥物质院安徽光学精密机械研究所。本科毕业于华东理工大学/密苏里大学化工学院,博士毕业于美国佐治亚理工学院化工学院,师从无机膜专家Sankar Nair教授;博后在美国德克萨斯大学高分子膜专家Benny Freeman院士和Joan Brennecke
院士组、沙特阿卜杜拉国王科技大学多孔分子筛膜专家赖志平教授组工作。长期从事强酸、强碱、高浓度等苛刻条件工业废水膜分离材料与过程的研究。目前的研究兴趣为环境光学监测与机器学习方法在化工、环境领域的应用;共轭微孔聚合物膜材料与氧化石墨烯膜材料开发;膜过程与相关化工过程的开发与商业化。以第一作者/通讯作者身份在Nature Sustainability(高被引论文)、AICHE Journal、Environmental Science & Technology、Water Research、ACS Sustainable Chemistry & Engineering等期刊发表多篇论文,科研成果获得多项美国专利并在美国造纸工业巨头转化。担任Journal of Membrane Science、Chemical Engineering Science等期刊审稿人。
第一作者:王纬嘉,女,硕士研究生,2025年6月毕业于安徽大学资源与环境工程学院。
文章链接:
https://doi.org/10.1016/j.watres.2025.123994
本文免费全文阅读链接(50天,有效期至2025年8月2日):
https://authors.elsevier.com/a/1lFsn9pi-hrM5
投稿:安徽大学资环学院徐春燕副教授、石先阳教授和中科院合肥物质院安徽光机所王中桢研究员等。投稿、合作、转载、进群,请添加小编微信Environmentor2020!环境人Environmentor是环境领域
最大的学术公号,拥有20W+活跃读者。由于微信修改了推送规则,请大家将环境人Environmentor加为星标,或每次看完后点击页面下端的“在看”,这样可以第一时间收到我们每日的推文!环境人Environmentor现有综合群、期刊投稿群、基金申请群、留学申请群、各研究领域群等共20余个,欢迎大家加小编微信Environmentor2020,我们会尽快拉您进入对应的群。