社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

西南交通大学张云辉团队JH|利用无监督机器学习和正定矩阵因子分解模型驱动煤矿农业区域的地下水化学成因和健康风险研究

生态环境科学 • 6 天前 • 119 次点击  

文章信息

第一作者:严雨婷

通讯作者:张云辉 副教授

通讯单位:西南交通大学地球科学与工程学院,宜宾西南交通大学研究院

https://doi.org/10.1016/j.jhydrol.2025.133691

亮点

• 利用自组织映射技术识别出了三类地下水。

• 铁和锰源于煤层中硫化物的溶解以及煤矿废水的排放。

• 农业活动是硝酸盐污染的主要成因。

• 敏感性分析从定量角度评估了与健康风险相关的因素及权重。

研究进展

识别和量化地下水中重金属和硝酸盐的地质来源及人为来源,对保障矿区农村地下水环境安全至关重要。然而,目前尚未提出用于阐明矿区农村地下水化学特征、特定污染物来源及相关概率健康风险的综合方法。本研究采用无监督机器学习、基于主成分分析的成分数据分析、正定矩阵因子分解和蒙特卡洛模拟健康风险等方法,对中国西南部重庆东北部某煤矿区的污染物来源及地下水饮用适宜性进行了量化分析。本研究有望为矿区农村地区的地下水可持续管理提供可靠且有力的依据(图1)。

图1 图文摘要

SOM模型与K-means将地下水样本分为三类,A组包括20个样本,B组包括8个样本,C组包括23个样本(图2)。三组样本在水文地质图上的位置表现出显著差异,A组为“碳酸盐岩型”,B组为“碎屑岩型”,C组为“混合岩型”。这证实了SOM模型的分类结果与研究区含水层岩性紧密吻合。

图2 20个变量的自组织映射图和相应的U矩阵图

Piper图是识别水化学类型的有效方法。Piper三线图显示出3个组之间的明显差别(图3a)。A组和B组在Piper三线图的菱形内位置独立,C组位于两者之间的过渡区。A组水化学类型为Ca-HCO3型。B组的水化学类型分为Ca-SO4型和混合Ca·Na-HCO3型。C组水化学类型介于A组和B组之间,为Ca-HCO3型和Ca-SO4型。该分类结果证实了A组和B组之间水化学类型的差异及C组的过渡性质,也证实SOM的分类结果是有效的。

图3 (a)Piper三线图;(b)TDS vs. TH

主要离子的离子比例是揭示地下水水化学过程的有效工具。在部分离子比例图中(图4a、b、c、e、f、g、h),A组和B组分别形成了独立的聚集区,C组位于中间过渡区。A组和C组中多数样品在Na+/Cl比值图中沿着y=x线绘制(图4a),表明岩盐溶解是Na+和Cl的主要来源。B组位于y=x线的下方,表明高浓度Na+来源于硅酸盐溶解和阳离子交换反应。B组SO42−明显高于y=x,浓度也高于A组和C组(图4b)。B组位于研究区西部,地层为须家河组。须家河组含煤层,高SO42−浓度由须家河组煤层中硫化物溶解所致。煤矿开采使地层环境由还原状态转变为相对开放的系统,促进了硫化物氧化,导致地下水中SO42−含量增加。在HCO3/Ca2+图(图4c)中,A组和B组的大部分地下水样品落在y=x和y=2x以下区域,说明Ca2+、Mg2+和HCO3来源于方解石和白云石的溶解。大多数样品位于Mg2+/Ca2+图中y=0.5x以下的区域(图4d),表明Ca2+和Mg2+浓度也受硅酸盐风化控制。A组和C组样本沿着y=x线排列,表明A组和C组NO3的主要来源是氮肥,B组的主要来源是城市污水(图4h)。NO3浓度高的样品位置与耕地并不完全相关,分布在大宁河附近。这是因为地下水流动在地下水中NO3的分布和迁移中起着重要作用。地下水从东部和西部流向研究区中部,导致研究区低海拔处NO3较高。

图4 离子比例图(a)Cl vs. Na+,(b)SO42− vs. Ca2+,(c)HCO3 vs. Ca2+,(d)Mg2+ vs. Ca2,(e)HCO3+SO42− vs. Ca2++Mg2+(f)(Ca2++Mg2+)–(HCO3 +SO42−)vs. Na++K++Cl,(g)CAI−II vs CAI−I,(h)NO3/Na+ vs. Cl/Na+

为了确定控制三组地下水水化学组分的不同水化学过程,对经过对数转换的数据开展主成分分析(PCA)(图5)。PC1和PC2共解释了原始数据中55.76%的信息。A组样品位于双标图左侧区域,与NO3、HCO3、Ca2+、F和Hg相关。B组样品位于右侧区域,与Fe、Mo、Mn、SO42−、Zn、Na+、Ni、Co和K+相关。C组样品位于A组和B组之间,与所有变量间相关性均较弱。NO3和Cl载体的顶点位于“链接1”,相对靠近A组,这一链接解释为农业活动和城市污水。Fe、Cu、Zn和SO42−的顶点形成“链接2”,与B组接近,与“链接1”正交。表明Fe、Cu、Zn和SO42−的来源相似,正交性意味两个链接相互独立。双标图中各组样本位置表现出明显差异,A组和B组相距较远,C组位于两者之前。综合三组样本的地理位置,A组位于湿地周围,受碳酸盐岩的影响,氮肥的施用和城市污水的排放导致NO3和Cl浓度升高。B组位于须家河组地层,受砂岩控制,煤层中黄铁矿结核的溶解导致较高SO42−浓度。C组位于A组和B组之间,受碳酸盐岩和硅酸盐岩的自然溶解控制。

图5 基于PCA双标图的成分数据分析

在CoDa-PCA定性解析的基础上,应用PMF模型量化化学组分的来源及贡献比例(图6a、b)。因子1受NO3(18.34%)、Cl(17.09%)、Mg2+(11.63%)和Ba(8.03%)影响。因子1反映了化肥施用、城市污水和矿物溶解的综合影响。因子2表征为HCO3(15.08%)、Ca2+(13.23%)、Ni(11.43%)、Co(10.69%)、Hg(10.66%)和F(10.03%)。Ni、Co和Hg的来源与HCO3、Ca2+和F类似,归因于地质成因。因子3主要受Cu(21.83%)、Zn(17.19%)、Na+(13.55%)和K+(12.10%)影响。Cu和Zn可能来源于矿物溶解,与Na+和K+类似。因子4与SO42−相关(29.41%)。SO42− 来源于煤层中黄铁矿的溶解和煤矿废水的排放。因子5受Fe(33.29%)、Mn(32.34%)和Mo(8.67%)影响。在相同位置观测到高浓度的Fe、Mn和Mo,表明具有共同的来源。因子贡献表明,以因子1和因子2为代表的氮肥过量施用、城市污水和碳酸盐岩溶解是地下水化学组分浓度升高的主要原因。CoDa-PCA与PMF的联合应用提高了三组地下水样本中复杂污染源的分析精度。

由于重金属浓度相对较低,源解析过程中经常被主要离子掩盖。为了解决这个问题,PMF模型被再次应用于重金属,以确定重金属的复杂潜在来源(图6c、d)。因子1中贡献最大的是Fe(39.51%)、Mn(36.65%)和Mo(18.66%),Fe、Mn和Mo表现出类似的空间分布。研究区地层为红层,含Fe-Mn氧化物浓度较高。因子1反映了Fe、Mn和Mo氧化物在红层中的富集。因子2与Ni(30.49%)和Co(27.32%)有关。Ni、Co和Fe的空间分布相似,局部高浓度位于研究区西部和中部。Co和Ni浓度来源于Co和Ni氧化物的溶解,褐铁矿(Fe2O3⋅nH2O)经常与Co和Ni氧化物混合。因子2反映了自然条件下伴随Fe氧化物的溶解释放Co和Ni。因子3中Ba贡献最大(53.47%)。研究区中Ba浓度为4.14~489.52 μg/L,Ba的高浓度样品点与Ca2+一致。因子3反映了自然条件下含Ba矿物(主要是重晶石)的溶解。因子4与Zn相关(48.27%)。Zn自然存在于地下水中,浓度为10~40 μg/L。本研究中大部分Zn浓度在40 μg/L以下。闪锌矿(ZnS)是Zn的主要来源,外源条件下,易风化成菱锌矿(ZnCO3)。因子4反映了含锌矿物的溶解,包括闪锌矿及其风化产物菱锌矿。因子5与Cu(51.92%)和Hg(26.26%)有关。地下水Cu和Hg的平均浓度分别为2.79 μg/L和0.03 μg/L,远低于Cu(1000 μg/L)和Hg(1 μg/L)的水质标准,表明Cu和Hg均受自然控制。Cu和Hg浓度高的地区与SO42−浓度高的地区相似,位于研究区西部。Hg主要以朱砂(HgS)的形式存在于煤中,几乎是Hg的唯一来源。黄铜矿(CuFeS2)是Cu的重要来源,常与其他硫化物共存。因此,地下水中Cu和Hg分别来源于朱砂和黄铜矿的溶解。因子5反映了自然条件下金属硫化物溶解产生的微量Cu和Hg。综上所述,地下水中重金属来源于地层中相关矿物的氧化物和硫化物的溶解,地层中矿物丰度控制重金属浓度。

图6 PMF解析结果(a)所有水化学组分的PMF解析结果,(b)所有水化学组分的5个因子的源贡献,(c)重金属的PMF解析结果,(d)重金属的5个因子的源贡献

为了查明研究区地下水水质,采用了组合权重水质指数(CWQI)评价饮用水水质,重金属污染指数(HPI)评价重金属污染水平。CWQI值为4.94~56.70,平均值为23.03。所有样品适合饮用(图7a)。相对较高的CWQI值集中在研究区的东北部(图7b)。HPI值为6.63~13.05,平均值为9.01。所有地下水样品HPI值均低于15,属于低污染(图7c)。从空间上看,HPI大于10的地下水样点位于研究区西部和北部。Zn、Fe、Mn、Ni和Co的浓度对HPI值有不同程度的正向影响(图7d)。

图7 (a)CWQI vs. TDS,(b)CWQI空间分布图,(c)HPI vs. TDS和(d)HPI空间分布图

累积概率密度曲线表示小于或等于x=a的所有值的发生概率之和。由于地下水中各组分的浓度不同,NO3的风险最高(图8),其次是F,风险最小的是重金属。此外,不同人群遭受的总潜在非癌症风险排序依次为儿童,男性和女性。概率性风险和确定性风险之间的差距反映了知识差距造成的不确定性,造成差距的原因是地下水样本的采集和检测有限。敏感性分析用于量化暴露参数和水化学组分对HI值的影响,本研究采用Sobol法开展敏感性分析。暴露参数(EF)是影响人类健康风险最显著的因素,对儿童、女性和男性的敏感性为89.91%(图9a、b和c)。化学组分中,NO3对人体健康危害较大。因此,科学施用化肥从而降低地下水NO3水平是控制地下水非致癌风险的最有效选择。儿童对体重比男性和女性更敏感,这是由于儿童体重较轻,代谢能力较低。

图8 (a)NO3、(b)F、(c)重金属(Mn+Ba+Ni+Mo)和(d)所有风险组分的健康人体风险评估

图9 (a)儿童、(b)女性和(c)男性的敏感性分析和(d)儿童、(e)女性和(f)男性的健康风险空间分布

综上,本研究通过无监督机器学习识别出了三组地下水样本。A组为Ca-HCO3型。B组为Ca-SO4型和Ca·Na-HCO3混合型。C组为Ca-HCO3型和Ca-SO4型。A组和C组以碳酸盐岩和硅酸盐岩溶解为主,B组以硅酸盐岩、黄铁矿和重金属氧化物溶解为主。所有地下水均受阳离子交换作用影响。农业活动和采矿污水排放是NO3污染的主要来源。CoDa-PCA证实了水化学图解、矿物饱和指数的分析结果。CoDa-PCA和PMF模型分别确定了3个主要水化学过程和5个影响因子,根据PMF模型和NBLs,Fe和Mn来源于红层中Fe和Mn氧化物溶解(25.91%)。Co、Ni、Ba、Zn、Cu、Hg的含量来源于其氧化物(22.35%)、重晶石(17.87%)、闪锌矿(17.85%)、黄铜矿和朱砂(16.02%)的溶解。所有地下水样本的组合权重水质指数和重金属污染指数均满足饮用许可,表明研究区地下水适合饮用。危害指数(HI)表明,地下水对儿童构成健康风险的概率约为6.01%。对人体健康风险最敏感的因子是暴露频率和NO3浓度。本研究可为矿区农村地下水可持续管理提供可靠和有力的依据。

作者介绍

严雨婷,西南交通大学地球科学与工程学院在读硕士研究生,研究方向为水化学成因及环境效应。目前在Journal of HydrologyJournal of Hazardous MaterialsScience of the Total EnvironmentJournal of Environmental ManagementJournal of Contaminant HydrologyEnvironmental Earth SciencesEnvironmental Science and Pollution Research等期刊上发表论文12篇。

张云辉,江西抚州人,西南交通大学地球科学与工程学院,副教授,民主党派中国民主促进会会员,SCI期刊Frontiers in Earth Science(JCR二区)副主编,核心期刊《成都理工大学学报》(自科版)、《沉积与特提斯地质》、《中国地质》英文版(China Geology)、《地球科学与环境学报》、《中国地质调查》首届青年编委,以及Geothermics等多个SCI期刊特邀主编,四川省风险管理研究会副秘书长,四川省矿物岩石地球化学学会副秘书长/地热分委会主任。从事大数据+数值模型融合驱动的地下水科学研究及应用,旨在推动多尺度多介质土壤-地下水污染物界面过程与调控研究。目前主持国家重点研发计划子课题、国家自然科学基金、四川省重点研发计划项目、西藏自治区重点研发计划子课题等国家级、省部级等项目十余项,以一作/通讯作者在Journal of HydrologyJournal of Hazardous MaterialsScience of the Total EnvironmentGeoscience FrontiersGeothermics等SCI期刊发表论文50余篇,HI指数27。

通讯邮箱:zhangyunhui@swjtu.edu.cn

投稿、转载、合作可在后台留言(备注:微信号)或发邮件至sthjkx1@163.com

【点击下方超链接阅读16个栏目推文】 
1.【直播】
9.【院士】
2.【视频
10.【综述】
3.【健康&毒理】
11.【写作】
4.【
12.【Nature】
5.【13.【Science】
6.【14.【WR】
7.【固废
15.【EST】
8.【生态】
16.【JHM】

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/183891
 
119 次点击