识别和量化地下水中重金属和硝酸盐的地质来源及人为来源,对保障矿区农村地下水环境安全至关重要。然而,目前尚未提出用于阐明矿区农村地下水化学特征、特定污染物来源及相关概率健康风险的综合方法。本研究采用无监督机器学习、基于主成分分析的成分数据分析、正定矩阵因子分解和蒙特卡洛模拟健康风险等方法,对中国西南部重庆东北部某煤矿区的污染物来源及地下水饮用适宜性进行了量化分析。本研究有望为矿区农村地区的地下水可持续管理提供可靠且有力的依据(图1)。
图1 图文摘要
SOM模型与K-means将地下水样本分为三类,A组包括20个样本,B组包括8个样本,C组包括23个样本(图2)。三组样本在水文地质图上的位置表现出显著差异,A组为“碳酸盐岩型”,B组为“碎屑岩型”,C组为“混合岩型”。这证实了SOM模型的分类结果与研究区含水层岩性紧密吻合。
图2 20个变量的自组织映射图和相应的U矩阵图
Piper图是识别水化学类型的有效方法。Piper三线图显示出3个组之间的明显差别(图3a)。A组和B组在Piper三线图的菱形内位置独立,C组位于两者之间的过渡区。A组水化学类型为Ca-HCO3型。B组的水化学类型分为Ca-SO4型和混合Ca·Na-HCO3型。C组水化学类型介于A组和B组之间,为Ca-HCO3型和Ca-SO4型。该分类结果证实了A组和B组之间水化学类型的差异及C组的过渡性质,也证实SOM的分类结果是有效的。
图3 (a)Piper三线图;(b)TDS vs. TH
主要离子的离子比例是揭示地下水水化学过程的有效工具。在部分离子比例图中(图4a、b、c、e、f、g、h),A组和B组分别形成了独立的聚集区,C组位于中间过渡区。A组和C组中多数样品在Na+/Cl−比值图中沿着y=x线绘制(图4a),表明岩盐溶解是Na+和Cl−的主要来源。B组位于y=x线的下方,表明高浓度Na+来源于硅酸盐溶解和阳离子交换反应。B组SO42−明显高于y=x,浓度也高于A组和C组(图4b)。B组位于研究区西部,地层为须家河组。须家河组含煤层,高SO42−浓度由须家河组煤层中硫化物溶解所致。煤矿开采使地层环境由还原状态转变为相对开放的系统,促进了硫化物氧化,导致地下水中SO42−含量增加。在HCO3−/Ca2+图(图4c)中,A组和B组的大部分地下水样品落在y=x和y=2x以下区域,说明Ca2+、Mg2+和HCO3−来源于方解石和白云石的溶解。大多数样品位于Mg2+/Ca2+图中y=0.5x以下的区域(图4d),表明Ca2+和Mg2+浓度也受硅酸盐风化控制。A组和C组样本沿着y=x线排列,表明A组和C组NO3−的主要来源是氮肥,B组的主要来源是城市污水(图4h)。NO3−浓度高的样品位置与耕地并不完全相关,分布在大宁河附近。这是因为地下水流动在地下水中NO3−的分布和迁移中起着重要作用。地下水从东部和西部流向研究区中部,导致研究区低海拔处NO3−较高。
图4 离子比例图(a)Cl− vs. Na+,(b)SO42− vs. Ca2+,(c)HCO3− vs. Ca2+,(d)Mg2+ vs. Ca2,(e)HCO3−+SO42− vs. Ca2++Mg2+(f)(Ca2++Mg2+)–(HCO3−
+SO42−)vs. Na++K++Cl−,(g)CAI−II vs CAI−I,(h)NO3−/Na+ vs. Cl−/Na+
为了确定控制三组地下水水化学组分的不同水化学过程,对经过对数转换的数据开展主成分分析(PCA)(图5)。PC1和PC2共解释了原始数据中55.76%的信息。A组样品位于双标图左侧区域,与NO3−、HCO3−、Ca2+、F和Hg相关。B组样品位于右侧区域,与Fe、Mo、Mn、SO42−、Zn、Na+、Ni、Co和K+相关。C组样品位于A组和B组之间,与所有变量间相关性均较弱。NO3−和Cl−载体的顶点位于“链接1”,相对靠近A组,这一链接解释为农业活动和城市污水。Fe、Cu、Zn和SO42−的顶点形成“链接2”,与B组接近,与“链接1”正交。表明Fe、Cu、Zn和SO42−的来源相似,正交性意味两个链接相互独立。双标图中各组样本位置表现出明显差异,A组和B组相距较远,C组位于两者之前。综合三组样本的地理位置,A组位于湿地周围,受碳酸盐岩的影响,氮肥的施用和城市污水的排放导致NO3−和Cl−浓度升高。B组位于须家河组地层,受砂岩控制,煤层中黄铁矿结核的溶解导致较高SO42−浓度。C组位于A组和B组之间,受碳酸盐岩和硅酸盐岩的自然溶解控制。
图5 基于PCA双标图的成分数据分析
在CoDa-PCA定性解析的基础上,应用PMF模型量化化学组分的来源及贡献比例(图6a、b)。因子1受NO3−(18.34%)、Cl−(17.09%)、Mg2+(11.63%)和Ba(8.03%)影响。因子1反映了化肥施用、城市污水和矿物溶解的综合影响。因子2表征为HCO3−(15.08%)、Ca2+(13.23%)、Ni(11.43%)、Co(10.69%)、Hg(10.66%)和F−(10.03%)。Ni、Co和Hg的来源与HCO3−、Ca2+和F−类似,归因于地质成因。因子3主要受Cu(21.83%)、Zn(17.19%)、Na+(13.55%)和K+(12.10%)影响。Cu和Zn可能来源于矿物溶解,与Na+和K+类似。因子4与SO42−相关(29.41%)。SO42−
来源于煤层中黄铁矿的溶解和煤矿废水的排放。因子5受Fe(33.29%)、Mn(32.34%)和Mo(8.67%)影响。在相同位置观测到高浓度的Fe、Mn和Mo,表明具有共同的来源。因子贡献表明,以因子1和因子2为代表的氮肥过量施用、城市污水和碳酸盐岩溶解是地下水化学组分浓度升高的主要原因。CoDa-PCA与PMF的联合应用提高了三组地下水样本中复杂污染源的分析精度。
由于重金属浓度相对较低,源解析过程中经常被主要离子掩盖。为了解决这个问题,PMF模型被再次应用于重金属,以确定重金属的复杂潜在来源(图6c、d)。因子1中贡献最大的是Fe(39.51%)、Mn(36.65%)和Mo(18.66%),Fe、Mn和Mo表现出类似的空间分布。研究区地层为红层,含Fe-Mn氧化物浓度较高。因子1反映了Fe、Mn和Mo氧化物在红层中的富集。因子2与Ni(30.49%)和Co(27.32%)有关。Ni、Co和Fe的空间分布相似,局部高浓度位于研究区西部和中部。Co和Ni浓度来源于Co和Ni氧化物的溶解,褐铁矿(Fe2O3⋅nH2O)经常与Co和Ni氧化物混合。因子2反映了自然条件下伴随Fe氧化物的溶解释放Co和Ni。因子3中Ba贡献最大(53.47%)。研究区中Ba浓度为4.14~489.52 μg/L,Ba的高浓度样品点与Ca2+一致。因子3反映了自然条件下含Ba矿物(主要是重晶石)的溶解。因子4与Zn相关(48.27%)。Zn自然存在于地下水中,浓度为10~40 μg/L。本研究中大部分Zn浓度在40 μg/L以下。闪锌矿(ZnS)是Zn的主要来源,外源条件下,易风化成菱锌矿(ZnCO3)。因子4反映了含锌矿物的溶解,包括闪锌矿及其风化产物菱锌矿。因子5与Cu(51.92%)和Hg(26.26%)有关。地下水Cu和Hg的平均浓度分别为2.79 μg/L和0.03 μg/L,远低于Cu(1000 μg/L)和Hg(1 μg/L)的水质标准,表明Cu和Hg均受自然控制。Cu和Hg浓度高的地区与SO42−浓度高的地区相似,位于研究区西部。Hg主要以朱砂(HgS)的形式存在于煤中,几乎是Hg的唯一来源。黄铜矿(CuFeS2)是Cu的重要来源,常与其他硫化物共存。因此,地下水中Cu和Hg分别来源于朱砂和黄铜矿的溶解。因子5反映了自然条件下金属硫化物溶解产生的微量Cu和Hg。综上所述,地下水中重金属来源于地层中相关矿物的氧化物和硫化物的溶解,地层中矿物丰度控制重金属浓度。
图6 PMF解析结果(a)所有水化学组分的PMF解析结果,(b)所有水化学组分的5个因子的源贡献,(c)重金属的PMF解析结果,(d)重金属的5个因子的源贡献
为了查明研究区地下水水质,采用了组合权重水质指数(CWQI)评价饮用水水质,重金属污染指数(HPI)评价重金属污染水平。CWQI值为4.94~56.70,平均值为23.03。所有样品适合饮用(图7a)。相对较高的CWQI值集中在研究区的东北部(图7b)。HPI值为6.63~13.05,平均值为9.01。所有地下水样品HPI值均低于15,属于低污染(图7c)。从空间上看,HPI大于10的地下水样点位于研究区西部和北部。Zn、Fe、Mn、Ni和Co的浓度对HPI值有不同程度的正向影响(图7d)。
图7 (a)CWQI vs. TDS,(b)CWQI空间分布图,(c)HPI vs. TDS和(d)HPI空间分布图
累积概率密度曲线表示小于或等于x=a的所有值的发生概率之和。由于地下水中各组分的浓度不同,NO3−的风险最高(图8),其次是F−,风险最小的是重金属。此外,不同人群遭受的总潜在非癌症风险排序依次为儿童,男性和女性。概率性风险和确定性风险之间的差距反映了知识差距造成的不确定性,造成差距的原因是地下水样本的采集和检测有限。敏感性分析用于量化暴露参数和水化学组分对HI值的影响,本研究采用Sobol法开展敏感性分析。暴露参数(EF)是影响人类健康风险最显著的因素,对儿童、女性和男性的敏感性为89.91%(图9a、b和c)。化学组分中,NO3−对人体健康危害较大。因此,科学施用化肥从而降低地下水NO3−水平是控制地下水非致癌风险的最有效选择。儿童对体重比男性和女性更敏感,这是由于儿童体重较轻,代谢能力较低。
图8 (a)NO3−、(b)F−、(c)重金属(Mn+Ba+Ni+Mo)和(d)所有风险组分的健康人体风险评估
图9 (a)儿童、(b)女性和(c)男性的敏感性分析和(d)儿童、(e)女性和(f)男性的健康风险空间分布
综上,本研究通过无监督机器学习识别出了三组地下水样本。A组为Ca-HCO3型。B组为Ca-SO4型和Ca·Na-HCO3混合型。C组为Ca-HCO3型和Ca-SO4型。A组和C组以碳酸盐岩和硅酸盐岩溶解为主,B组以硅酸盐岩、黄铁矿和重金属氧化物溶解为主。所有地下水均受阳离子交换作用影响。农业活动和采矿污水排放是NO3−污染的主要来源。CoDa-PCA证实了水化学图解、矿物饱和指数的分析结果。CoDa-PCA和PMF模型分别确定了3个主要水化学过程和5个影响因子,根据PMF模型和NBLs,Fe和Mn来源于红层中Fe和Mn氧化物溶解(25.91%)。Co、Ni、Ba、Zn、Cu、Hg的含量来源于其氧化物(22.35%)、重晶石(17.87%)、闪锌矿(17.85%)、黄铜矿和朱砂(16.02%)的溶解。所有地下水样本的组合权重水质指数和重金属污染指数均满足饮用许可,表明研究区地下水适合饮用。危害指数(HI)表明,地下水对儿童构成健康风险的概率约为6.01%。对人体健康风险最敏感的因子是暴露频率和NO3−浓度。本研究可为矿区农村地下水可持续管理提供可靠和有力的依据。