社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

德国图宾根大学ES&T:使用机器学习方法对土壤中PFAS吸附进行建模

环境人Environmentor • 1 月前 • 50 次点击  
图片


摘 要





本研究介绍了PFASorptionML,这是一种新的机器学习(ML)工具,用于预测土壤中全氟和多氟烷基物质(PFAS)的固液分布系数(Kd)。该模型利用土壤和沉积物中1274条PFAS的Kd数据集,包括三氟乙酸盐、阳离子和两性离子PFAS以及中性氟调聚醇等化合物,结合PFAS的特定性质,如分子量、疏水性和pKa,以及pH、结构、有机碳含量和阳离子交换能力等土壤特征。敏感性分析表明,分子量、疏水性和有机碳含量是影响吸附行为的最重要因素,而电荷密度和矿物土壤分数的影响相对较小。该模型显示出很高的预测性能,在验证数据集中,RPD值超过3.16,在准确性和范围上优于现有工具。值得注意的是,PFAS链长和官能团变异性显著影响Kd,较长的链长和较高的疏水性与Kd呈正相关。通过整合特定位置的土壤存储库数据,该模型能够为选定的PFAS物种生成空间Kd图。这些功能在在线平台PFASorptionML中实现,为研究人员和从业者提供了宝贵的资源,用于对土壤中的PFAS污染进行环境风险评估。

图片

研究背景

全氟和多氟烷基物质(PFAS)是一种人为化合物,由于其稳固的C-F键具有很高的环境持久性。目前,PFAS被定义为含有至少一个完全氟化的甲基或亚甲基碳原子(没有任何H/Cl/Br/I原子连接)的物质。PFAS代表了一个多样化的化学类别,具有广泛的工业和消费应用,包括水性消防泡沫(AFFF)、电子、建筑材料和纸制品涂料。阴离子型PFAS,如PFCA和PFSA,因其存在、吸附和毒性而得到了广泛的研究,但中性、阳离子和/或两性离子PFAS很可能出现在某些AFFF污染的场所中。目前的监管限制将PFAS视为一个整体,但其中仍一些PFAS的吸附行为被忽视了。

PFAS污染十分普遍,土壤中的浓度从偏远地区的pg/g−1到受影响地点的数百μg/g−1不等。土壤既是地下水中PFAS污染的过滤器,也是污染源。了解PFAS在土壤中的吸附对于通过为风险评估、修复策略和监管决策提供信息来缓解相关的环境问题至关重要。吸附参数,如固液分布系数(Kd),可以模拟饱和和非饱和条件下的污染物迁移。在非饱和土壤中,还应考虑空气-水分配系数(Kaw),因为它可能导致污染物滞留在空气-水界面。Kd值可以通过有机碳归一化吸附系数(KOC)或考虑某些土壤和PFAS特性的预测模型来估算。这些工具有局限性,它们的PFAS范围狭窄,依赖于过于简单的假设,忽视了复杂的PFAS与土壤的相互作用。此外,缺乏评估现有模型预测性能的研究,以及对影响吸附的PFAS特征的系统分析(例如,PFAS链长和官能团的影响)。

机器学习(ML)已成为一种强大的方法,用于在大型多维数据集中建模复杂的非线性关系,以揭示传统模型可能忽视的模式和相关性。最近,一个基于文献的Kd(PFAS)数据集的ML模型被开发出来,该数据集由26个不同阴离子PFAS的2328个条目组成。验收数据标准考虑了不同pH条件下相同PFAS/土壤对的Kd值,特别是那些来自单一研究的Kd。然而,pKa值在环境相关pH范围内的可电离PFAS形态未被考虑(例如,全氟磺胺类药物(FOSA),pKa≈6)。

本研究系统地汇编了一个基于PFAS Kd的综合文献数据集,其中包含51种不同PFAS的1274个条目,包括阴离子、中性、阳离子和两性离子物种。使用ML算法,开发了一种新的模型,该模型集成了PFAS-(即分子量(MW)、疏水性、pKa)和土壤特异性(即pH、质地、阳离子交换容量(CEC)、有机碳含量(Corg))等。与其他现有工具相比,该模型显示出卓越的预测性能,当与特定位置的土壤数据(如欧盟LUCAS表土库)相结合时,能够生成空间Kd图。

主要发现

1、链长对PFAS吸附的影响

对于数据集中的每个条目(图1),Kd都转换为KOC,以考虑土壤不同Corg值引起的变化。然后,使用KOC对数来评估PFAS链长和官能团在吸附中的作用。对不同的logKOC群体进行了统计测试。PFCA的平均logKOC数据范围为1.18至5.25,并随着氟化碳数量的增加而增加,与其他观察结果一致。氟化碳少于六个的PFCA的KOC群体在统计上是相等的,并且通常随着CF2 部分增加而增加。PFSA、FOSA、FTOH、FTS和PFPA也观察到类似的结果,但阳离子和两性离子PFAS和PFPiA亚家族的这一趋势并不明显。在数据集中,短PFAS链对KOC产生次要影响,但尚不完全清楚实验测试如何导致这个结果(例如,在较大的液固比下可靠地确定非常小的Kd值,从而可能高估)。总体而言,特定PFAS亚家族的logKOC通常随着链长的增加而增加,特别是对于含有六个或更多氟化碳的PFAS,这可能是由于与土壤有机物更有效的疏水相互作用。


图片

图1 Kd(PFAS)数据集中各PFAS亚家族及其相应化合物的相对分布,包括全氟羧酸(PFCA)、全氟磺酰胺(FOSA)、全氟磺酸(PFSA)、氟代聚醚磺酸盐(FTS)、全氟膦酸(PFPA)、氟代聚醚醇(FTOH)、全氟烷基醚羧酸(PFECA)、全氟辛烷磺酰氨基乙酸(FOSAA)、氯化多氟烷基醚磺酸盐(PFAES)、全氟磷酰(PFPiA)以及阳离子和两性离子PFAS。


2、官能团在PFAS吸附中的作用

对logKOC群体进行了评估,以阐明PFAS官能团对不同数量氟化碳(即4、6、8和10)化合物吸附的影响。对于那些氟化碳少于7的PFAS,无论官能团如何,logKOC群体通常都是相似的,但对于氟化碳超过6的PFAS来说,官能团的影响是显著的。吸附亲和力趋势如下:PFPA ≥ PFCA ≥ PFSA ≈ FTS < FOSA ≥ FTOH ≥ 阳离子和两性离子PFAS。与PFCA的羧酸根基团的单负电荷相比,PFPA观察到的较低吸附可归因于它们的双负电荷膦酸酯基团,导致与带负电荷的表面产生更有效的静电排斥,从而降低其吸附。与PFCA相比,PFSA观察到的较高吸附与之前的观察结果一致,这可能是由于磺酸盐部分提供了更大的疏水性。在这方面,调聚物磺酸盐的logKOC值高于磺酸盐基团的值,这可能是由于-CH2-CH2-部分提供了额外的疏水性。磺酰胺,特别是调聚物醇官能团的logKOC值明显高于其他官能团,这可能是由于它们通常不带电的性质,来防止带负电荷颗粒的静电排斥,从而增加其吸附。阳离子和两性离子PFAS的logKOC值最高,可能是由于带正电荷的PFAS物种和带负电荷的粘土表面之间的吸引力导致对KOC的高估,从而增加了吸附。同样,PFAES的log KOC数据是观察到的最高值,可能是因为来自矿物土壤的数据(即Corg<2.7%)导致KOC的过高估计。

3、异常值和异常趋势的识别

PFAS疏水性(即KOW)随着PFAS的氟化碳数量的增加而增加。根据初步数据探索,由于疏水相互作用在吸附中起着重要作用,预计KOC和KOW之间呈正相关。因此,将logKOC平均数据与logKOW进行筛选,无论亚家族PFAS类型如何,都获得了正线性关系(见图2)。尽管如此,四种PFAS物种(即6:2 FtSaAm、C6/6PFPiA、C6/8PFPiA和C8/8 PFPiA)显示出明显的差异趋势。据我们所知,Cx/y PFPiA的吸附仅在一项研究中进行了评估,该研究得出结论,与其他PFCA和PFSA的观察结果相反,这些物种的吸附并没有随着有机物含量的增加而增加。获得额外光谱或计算证据支持的新实验数据将有助于确认Cx/y PFDiA的吸附是否由其他未知的吸附机制驱动。另一方面,6:2 FtSaAm的吸附来自有机物含量低(即0.1%)的单一土壤样本,表明由于吸附主要来自矿物成分,KOC被高估了。这四个PFAS的Kd数据被视为进一步模型评估的异常值。PFAS的logKOC和logKOW之间的关系(log KOC=0.58 log KOW+0.06;n=47;r2=0.83;图2)不同于对其他有机污染物观察到的线性相关性,如多环芳烃(PAH,logKOC=0.97 log KOW+0.12;n=106;r2=0.93)和几种非极性疏水性有机化合物(HOC,logKOC=1.10 logKOW+0.99;n=418;r2=0.95),可能是由于本研究中考虑的大多数PFAS具有带电性质。


图片

图2 不同PFAS种类的logKOC与logKOW之间的关系,包括全氟羧酸(PFCA)、全氟磺酰胺(FOSA)、全氟磺酸(PFSA)、氟代聚醚磺酸盐(FTS)、全氟膦酸(PFPA)、氟代聚醚醇(FTOH)、全氟烷基醚羧酸(PFECA)、全氟辛烷磺酰氨基乙酸(FOSAA)、氯化多氟烷基醚磺酸(PFAES)、全氟膦酸(PFPiA)以及阳离子和两性PFAS。识别出的PFAS异常值标记为“X”。虚线表示排除异常值后的整体数据回归。


4、模型性能和灵敏度分析

对于所有考虑的PFAS物种,预测的logKd值与观测值非常一致(图3),斜率接近1(即0.90),y截距接近0(即0.09)。NRMSE和RPD值分别为0.07和3.16,10k倍CV-NRMSE值为0.09,表明该模型具有出色的预测能力。残差评估显示,残差平均值约为零logKd单位,表明没有普遍的低估或高估,标准偏差为0.30。残差分布的偏斜度为-0.04 logKd单位,沿土壤重心没有明显偏差(图3)。基于同一测试集(不包括电荷密度特征)的额外建模尝试导致Kd(PFAS)的预测更差,NRMSE为0.08,RPD为2.59。

与其他目前可用的Kd(PFAS)预测工具相比,PSSM显示出更好的预测性能,例如仅考虑有机和矿物吸附位点的模型得出的预测工具。除了通常预测的PFCA和PFSA的良好性能外,该模型还成功预测了两种特征相反的土壤中TFA的Kd值,以及不同阳离子和两性离子PFAS(如PFOAB、PFOAAmS、AmPr FHxSA、TAmPr FHxSA和6:2 FtSaB)的Kd数值(图3)。


图片

图3 散点图比较了不同PFAS物种预测值与测量值的logKd。右下角子图展示了残差分布,平均值约为零logKd单位,标准差为0.30,偏度为−0.04logKd单位。左上角子图则按不同土壤有机质含量分层显示了残差分布。


尽管由于不同的形态,可电离化合物的吸附可能因pH值而异,但对不同pH值土壤中阳离子、两性离子和FOSA物种的准确预测证实了将PFAS形态纳入模型的必要性。对PFPA、FOSA、FOSAA、PFECA、PFAES、FTS和FTOH组也观察到良好的预测。总体而言,该模型的成功验证和高指标质量突显了其在风险评估研究中的潜在用途,旨在评估污染场地中PFAS的流动性。尽管该模型在饱和条件下对吸附表现出很强的预测能力,并有效地结合了PFAS的形态,但其适用性仅限于预定义特性范围内的化合物和土壤,因为ML很难将预测准确地外推到其他情况。此外,该模型可以通过纳入影响PFAS运输的其他物理因素来扩展,例如非饱和条件下的空气-水界面,该界面最终受土壤湿度的控制,因此受季节变化的影响。关于季节变化,到目前为止,该模型还没有考虑到温度引起的PFAS Kd值的变化(根据之前的研究,如果温度从15°C上升到35°C,Kd可能会增加高达60%)。

敏感性分析(图4)表明,MW是最敏感的特征,特别是区分PFAS物种。如SHAP值(图4A)和PD分析(图4B)所示,较高的MW值与增加的logKd相关。分析表明Corg是影响吸附的主要土壤特性,这一结果与PFAS对有机物的强亲和力一致。在我们的模型中,Corg对logKd有积极贡献,表明有机碳含量是PFAS吸附的关键土壤驱动因素,这一点得到了SHAP和PD分析的证实。LogKOW成为第三个最重要的特征,SHAP和PD都表明,高logKOW值与高logKd相关。Corg和KOW的影响都支持疏水相互作用是PFAS吸附的核心机制的假设。此外,电荷密度被确定为第四名有影响的特征,表明静电相互作用对PFAS吸附影响最小。CEC的影响排名第五,随着CEC值的增加,吸附作用也在增加,这可能是由于与更高的Corg含量和可交换吸附位点的可用性增加的间接关联,特别适合吸附阳离子和两性离子物种。相反,增加pH值通常会降低Kd(PFAS),这可能是由于促进了带负电荷的PFAS物种的更高丰度,以及粘土(pHZPC≈3)和Corg(pHZPC≈8)组分中负电荷的增加,从而增加了这些结构域的静电排斥。最后,土壤质地对模型的预测影响有限,表明与Corg相比,粒径在PFAS吸附中的作用较小。然而,在低Corg情景中,包括这些变量仍可能提高预测精度。


图片

图4 (A) SHAP综合图展示了各个特征对Kd预测的影响。特征按其对模型输出的重要性从高到低排列,每个点代表一个样本。颜色从蓝色(低)渐变到红色(高),表示特征值,而水平位置反映了模型输出的变化,其中负的SHAP值对应较低的输出值,正的SHAP值则表示较高的输出值。(B)部分依赖(PD)显示了每个输入特征对Kd的边际效应,基于所有样本的平均值。


5、环境意义

开发的模型(即PSSM)通过利用PFAS特定和土壤依赖的输入参数,为预测47个PFAS的Kd提供了广泛的适用性。凭借这种灵活性,该模型可以应用于任何规模和分辨率的空间土壤特性数据存储库,以生成Kd(PFAS)预测地图。我们将PSSM应用于欧洲土壤的LUCAS 2009存储库数据(欧洲土壤数据中心:ESDAC)。图5显示了全氟辛基磺酰溴的Kd图。总体而言,该模型允许识别地理位置具有潜在低Kd值的图形区域(即PFAS可能具有较高流动性的位置),从而促进其向地下水位的迁移。因此,我们的模型输出与其他PFAS表层土浓度数据和地下水信息的结合可用于饱和区的全球PFAS输运研究。然而,这些大规模评估可能会忽视土壤性质的局部异质性,除非有高分辨率的地理空间数据可用,否则可能会在Kd预测中引入额外的不确定性。


图片

图5 基于LUCAS 2009数据库中的土壤属性,使用堆叠模型预测欧洲PFOSB的log Kd值。没有可用土壤数据的区域标记为“无数据”。


为了克服这些土壤空间异质性的限制,我们提供了一个在线平台(PFASorptionML)来预测特定场地的Kd(PFAS)值。所需的输入参数是待评估的PFAS(即,CAS编号、PFAS的全称或缩写)和特定土壤特性(即pH、Corg、CEC、土壤质地)。利用这些信息,生成了PFAS特定的pH形态图,并进行了Kd预测。此外,该平台允许为本研究中考虑的所有47个PFAS生成任何比例(如欧盟)的Kd图。对目前缺乏吸附数据的其他PFAS模型的进一步评估是有意义的,有待进一步研究。计划对平台进行升级,包括生成额外的地理Kd图(例如全球),并考虑额外的运输参数,如特定的空气-水界面和非饱和条件下的Kaw。除了表层土特性外,还可以包括底土,以便更真实地模拟穿过包气带进入地下水的运输。考虑到PSSM模型的局限性,这项研究的结果可以整合到风险评估中,以评估PFAS在土壤和含水层中的流动性。


图片

来源:新污染物筛查与评估投稿、合作、转载、进群,请添加小编微信Environmentor2020!环境人Environmentor是环境领最大的学术公号,拥有20W+活跃读者 。由于微信修改了推送规则,请大家将环境人Environmentor加为星标,或每次看完后点击页面下端的“在看”,这样可以第一时间收到我们每日的推文!环境人Environmentor现有综合群、期刊投稿群、基金申请群、留学申请群、各研究领域群等共20余个,欢迎大家加小编微信Environmentor2020,我们会尽快拉您进入对应的群。


图片

往期推荐

年度热点文章Top10(2024年)
中科大俞汉青院士、陈洁洁教授、华中科大黄明杰Nat. Commun.:精准定制高价金属氧化物的d带中心实现污染物完全聚合去除
香港城市大学袁志国院士、新南威尔士大学郑敏Nature Sustainability综述:污水资源化前沿路径
Nature:全球塑料垃圾中的“潜行者”
中国科学院生态环境研究中心俞文正课题组Nature Water:三价金属混凝去除天然有机物的分子尺度理论
清华大学曲久辉院士团队刘锐平、中国科学技术大学陈洁洁Angew:纳米-生物杂合体界面间电子定向转移实现硝酸盐选择性转化
浙江大学环境纳米技术研究团队Nature Water:晶格工程实现纳米零价铁的高效选择性还原反应
山大刘建、港理工金灵等ES&T封面:联合提出“微塑料组”呼吁以整体视角研究微塑料以捕获其在真实世界中的生态与健康影响
哈工大(深圳)任南琪院士团队陈以頔、阿德莱德大学段晓光ES&T补充封面:聚焦微污染物聚合转化研究
大连理工陈景文团队、哈工大姜杰团队、宾大Joseph S. Francisco教授JACS:全多氟烷基化合物在微液滴表面自发降解
ESE专栏 | 《中国碳中和与清洁空气协同路径年度报告》工作组:2022年中国碳中和与清洁空气协同路径报告——提速重点部门转型
学术招聘
美国范德堡大学环境工程研究生项目招生 (博士硕士)
加州大学河滨分校化学与环境工程系门玉洁课题组招收博士生(或博士后)
香港城市大学能源与环境学院Dr. Sam H. Y. HSU课题组招聘博士
美国圣母大学环境分子与合成生物学实验室拟招收2名全奖博士生
瑞典斯德哥尔摩大学和瑞士Eawag联合招聘全奖博士生(环境方向)
北京大学环境科学与工程学院赵华章教授团队招聘博士
学术资讯
耶鲁大学Julie B. Zimmerman教授出任ES&T主编
贝勒大学Bryan W. Brooks教授出任ES&T Letters主编
韩国科学院院士Wonyong Choi将出任ACS ES&T Engineering创刊主编
CEJ Advances创刊 | 潘丙才教授任主编,四位华人学者任副主编
ACS对话 | ACS ES&T Engineering创刊副主编马军院士
专访:Environmental Science & Ecotechnology 主编团队

图片

图片
图片

扫描二维码,快速入群~

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/181775
 
50 次点击