1、链长对PFAS吸附的影响
对于数据集中的每个条目(图1),Kd都转换为KOC,以考虑土壤不同Corg值引起的变化。然后,使用KOC对数来评估PFAS链长和官能团在吸附中的作用。对不同的logKOC群体进行了统计测试。PFCA的平均logKOC数据范围为1.18至5.25,并随着氟化碳数量的增加而增加,与其他观察结果一致。氟化碳少于六个的PFCA的KOC群体在统计上是相等的,并且通常随着CF2
部分增加而增加。PFSA、FOSA、FTOH、FTS和PFPA也观察到类似的结果,但阳离子和两性离子PFAS和PFPiA亚家族的这一趋势并不明显。在数据集中,短PFAS链对KOC产生次要影响,但尚不完全清楚实验测试如何导致这个结果(例如,在较大的液固比下可靠地确定非常小的Kd值,从而可能高估)。总体而言,特定PFAS亚家族的logKOC通常随着链长的增加而增加,特别是对于含有六个或更多氟化碳的PFAS,这可能是由于与土壤有机物更有效的疏水相互作用。
图1 Kd(PFAS)数据集中各PFAS亚家族及其相应化合物的相对分布,包括全氟羧酸(PFCA)、全氟磺酰胺(FOSA)、全氟磺酸(PFSA)、氟代聚醚磺酸盐(FTS)、全氟膦酸(PFPA)、氟代聚醚醇(FTOH)、全氟烷基醚羧酸(PFECA)、全氟辛烷磺酰氨基乙酸(FOSAA)、氯化多氟烷基醚磺酸盐(PFAES)、全氟磷酰(PFPiA)以及阳离子和两性离子PFAS。
2、官能团在PFAS吸附中的作用
对logKOC群体进行了评估,以阐明PFAS官能团对不同数量氟化碳(即4、6、8和10)化合物吸附的影响。对于那些氟化碳少于7的PFAS,无论官能团如何,logKOC群体通常都是相似的,但对于氟化碳超过6的PFAS来说,官能团的影响是显著的。吸附亲和力趋势如下:PFPA ≥ PFCA ≥ PFSA ≈ FTS < FOSA ≥ FTOH ≥ 阳离子和两性离子PFAS。与PFCA的羧酸根基团的单负电荷相比,PFPA观察到的较低吸附可归因于它们的双负电荷膦酸酯基团,导致与带负电荷的表面产生更有效的静电排斥,从而降低其吸附。与PFCA相比,PFSA观察到的较高吸附与之前的观察结果一致,这可能是由于磺酸盐部分提供了更大的疏水性。在这方面,调聚物磺酸盐的logKOC值高于磺酸盐基团的值,这可能是由于-CH2-CH2-部分提供了额外的疏水性。磺酰胺,特别是调聚物醇官能团的logKOC值明显高于其他官能团,这可能是由于它们通常不带电的性质,来防止带负电荷颗粒的静电排斥,从而增加其吸附。阳离子和两性离子PFAS的logKOC值最高,可能是由于带正电荷的PFAS物种和带负电荷的粘土表面之间的吸引力导致对KOC的高估,从而增加了吸附。同样,PFAES的log KOC数据是观察到的最高值,可能是因为来自矿物土壤的数据(即Corg<2.7%)导致KOC的过高估计。
3、异常值和异常趋势的识别
PFAS疏水性(即KOW)随着PFAS的氟化碳数量的增加而增加。根据初步数据探索,由于疏水相互作用在吸附中起着重要作用,预计KOC和KOW之间呈正相关。因此,将logKOC平均数据与logKOW进行筛选,无论亚家族PFAS类型如何,都获得了正线性关系(见图2)。尽管如此,四种PFAS物种(即6:2 FtSaAm、C6/6PFPiA、C6/8PFPiA和C8/8 PFPiA)显示出明显的差异趋势。据我们所知,Cx/y PFPiA的吸附仅在一项研究中进行了评估,该研究得出结论,与其他PFCA和PFSA的观察结果相反,这些物种的吸附并没有随着有机物含量的增加而增加。获得额外光谱或计算证据支持的新实验数据将有助于确认Cx/y PFDiA的吸附是否由其他未知的吸附机制驱动。另一方面,6:2 FtSaAm的吸附来自有机物含量低(即0.1%)的单一土壤样本,表明由于吸附主要来自矿物成分,KOC被高估了。这四个PFAS的Kd数据被视为进一步模型评估的异常值。PFAS的logKOC和logKOW之间的关系(log KOC=0.58 log KOW+0.06;n=47;r2=0.83;图2)不同于对其他有机污染物观察到的线性相关性,如多环芳烃(PAH,logKOC=0.97 log KOW+0.12;n=106;r2=0.93)和几种非极性疏水性有机化合物(HOC,logKOC=1.10 logKOW+0.99;n=418;r2=0.95),可能是由于本研究中考虑的大多数PFAS具有带电性质。
图2 不同PFAS种类的logKOC与logKOW之间的关系,包括全氟羧酸(PFCA)、全氟磺酰胺(FOSA)、全氟磺酸(PFSA)、氟代聚醚磺酸盐(FTS)、全氟膦酸(PFPA)、氟代聚醚醇(FTOH)、全氟烷基醚羧酸(PFECA)、全氟辛烷磺酰氨基乙酸(FOSAA)、氯化多氟烷基醚磺酸(PFAES)、全氟膦酸(PFPiA)以及阳离子和两性PFAS。识别出的PFAS异常值标记为“X”。虚线表示排除异常值后的整体数据回归。
4、模型性能和灵敏度分析
对于所有考虑的PFAS物种,预测的logKd值与观测值非常一致(图3),斜率接近1(即0.90),y截距接近0(即0.09)。NRMSE和RPD值分别为0.07和3.16,10k倍CV-NRMSE值为0.09,表明该模型具有出色的预测能力。残差评估显示,残差平均值约为零logKd单位,表明没有普遍的低估或高估,标准偏差为0.30。残差分布的偏斜度为-0.04 logKd单位,沿土壤重心没有明显偏差(图3)。基于同一测试集(不包括电荷密度特征)的额外建模尝试导致Kd(PFAS)的预测更差,NRMSE为0.08,RPD为2.59。
与其他目前可用的Kd(PFAS)预测工具相比,PSSM显示出更好的预测性能,例如仅考虑有机和矿物吸附位点的模型得出的预测工具。除了通常预测的PFCA和PFSA的良好性能外,该模型还成功预测了两种特征相反的土壤中TFA的Kd值,以及不同阳离子和两性离子PFAS(如PFOAB、PFOAAmS、AmPr FHxSA、TAmPr FHxSA和6:2 FtSaB)的Kd数值(图3)。
图3 散点图比较了不同PFAS物种预测值与测量值的logKd。右下角子图展示了残差分布,平均值约为零logKd单位,标准差为0.30,偏度为−0.04logKd单位。左上角子图则按不同土壤有机质含量分层显示了残差分布。
尽管由于不同的形态,可电离化合物的吸附可能因pH值而异,但对不同pH值土壤中阳离子、两性离子和FOSA物种的准确预测证实了将PFAS形态纳入模型的必要性。对PFPA、FOSA、FOSAA、PFECA、PFAES、FTS和FTOH组也观察到良好的预测。总体而言,该模型的成功验证和高指标质量突显了其在风险评估研究中的潜在用途,旨在评估污染场地中PFAS的流动性。尽管该模型在饱和条件下对吸附表现出很强的预测能力,并有效地结合了PFAS的形态,但其适用性仅限于预定义特性范围内的化合物和土壤,因为ML很难将预测准确地外推到其他情况。此外,该模型可以通过纳入影响PFAS运输的其他物理因素来扩展,例如非饱和条件下的空气-水界面,该界面最终受土壤湿度的控制,因此受季节变化的影响。关于季节变化,到目前为止,该模型还没有考虑到温度引起的PFAS Kd值的变化(根据之前的研究,如果温度从15°C上升到35°C,Kd可能会增加高达60%)。
敏感性分析(图4)表明,MW是最敏感的特征,特别是区分PFAS物种。如SHAP值(图4A)和PD分析(图4B)所示,较高的MW值与增加的logKd相关。分析表明Corg是影响吸附的主要土壤特性,这一结果与PFAS对有机物的强亲和力一致。在我们的模型中,Corg对logKd有积极贡献,表明有机碳含量是PFAS吸附的关键土壤驱动因素,这一点得到了SHAP和PD分析的证实。LogKOW成为第三个最重要的特征,SHAP和PD都表明,高logKOW值与高logKd相关。Corg和KOW的影响都支持疏水相互作用是PFAS吸附的核心机制的假设。此外,电荷密度被确定为第四名有影响的特征,表明静电相互作用对PFAS吸附影响最小。CEC的影响排名第五,随着CEC值的增加,吸附作用也在增加,这可能是由于与更高的Corg含量和可交换吸附位点的可用性增加的间接关联,特别适合吸附阳离子和两性离子物种。相反,增加pH值通常会降低Kd(PFAS),这可能是由于促进了带负电荷的PFAS物种的更高丰度,以及粘土(pHZPC≈3)和Corg(pHZPC≈8)组分中负电荷的增加,从而增加了这些结构域的静电排斥。最后,土壤质地对模型的预测影响有限,表明与Corg相比,粒径在PFAS吸附中的作用较小。然而,在低Corg情景中,包括这些变量仍可能提高预测精度。
图4 (A) SHAP综合图展示了各个特征对Kd预测的影响。特征按其对模型输出的重要性从高到低排列,每个点代表一个样本。颜色从蓝色(低)渐变到红色(高),表示特征值,而水平位置反映了模型输出的变化,其中负的SHAP值对应较低的输出值,正的SHAP值则表示较高的输出值。(B)部分依赖(PD)显示了每个输入特征对Kd的边际效应,基于所有样本的平均值。
5、环境意义
开发的模型(即PSSM)通过利用PFAS特定和土壤依赖的输入参数,为预测47个PFAS的Kd提供了广泛的适用性。凭借这种灵活性,该模型可以应用于任何规模和分辨率的空间土壤特性数据存储库,以生成Kd(PFAS)预测地图。我们将PSSM应用于欧洲土壤的LUCAS 2009存储库数据(欧洲土壤数据中心:ESDAC)。图5显示了全氟辛基磺酰溴的Kd图。总体而言,该模型允许识别地理位置具有潜在低Kd值的图形区域(即PFAS可能具有较高流动性的位置),从而促进其向地下水位的迁移。因此,我们的模型输出与其他PFAS表层土浓度数据和地下水信息的结合可用于饱和区的全球PFAS输运研究。然而,这些大规模评估可能会忽视土壤性质的局部异质性,除非有高分辨率的地理空间数据可用,否则可能会在Kd预测中引入额外的不确定性。
图5 基于LUCAS 2009数据库中的土壤属性,使用堆叠模型预测欧洲PFOSB的log Kd值。没有可用土壤数据的区域标记为“无数据”。
为了克服这些土壤空间异质性的限制,我们提供了一个在线平台(PFASorptionML)来预测特定场地的Kd(PFAS)值。所需的输入参数是待评估的PFAS(即,CAS编号、PFAS的全称或缩写)和特定土壤特性(即pH、Corg、CEC、土壤质地)。利用这些信息,生成了PFAS特定的pH形态图,并进行了Kd预测。此外,该平台允许为本研究中考虑的所有47个PFAS生成任何比例(如欧盟)的Kd图。对目前缺乏吸附数据的其他PFAS模型的进一步评估是有意义的,有待进一步研究。计划对平台进行升级,包括生成额外的地理Kd图(例如全球),并考虑额外的运输参数,如特定的空气-水界面和非饱和条件下的Kaw。除了表层土特性外,还可以包括底土,以便更真实地模拟穿过包气带进入地下水的运输。考虑到PSSM模型的局限性,这项研究的结果可以整合到风险评估中,以评估PFAS在土壤和含水层中的流动性。