社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

ACS ES&T Eng. | 基于自动机器学习的新型智能系统对工业规模的车库式干发酵中的沼气性能进行多目标预测和预警指导

ACS美国化学会 • 2 年前 • 250 次点击  

英文原题:Novel Intelligent System Based on Automated Machine Learning for Multiobjective Prediction and Early Warning Guidance of Biogas Performance in Industrial-Scale Garage Dry Fermentation

通讯作者:李叶青,中国石油大学(北京)

作者:Yi Zhang, Yun Zhao, Yijing Feng, Yating Yu, Yeqing Li*, Jian Li, Zhonghao Ren, Shuo Chen, Lu Feng, Junting Pan, Hongjun Zhou, and Yongming Han





近日,中国石油大学(北京)新能源能与材料学院李叶青副教授团队开发了一种基于自动化机器学习(AutoML)的新型智能系统,通过结合AutoML 算法(AutoGluon、H2O)、SHAP值法和多目标粒子群优化算法(MOPSO)以对工业规模的车库式干发酵系统进行多目标预测和预警优化指导。


厌氧消化(AD)是利用微生物活动来处理有机废弃物,减少环境污染和生产绿色可再生能源的有效方法。而干发酵是指反应器中的总固体含量超过15%的AD过程,即干厌氧消化。但干发酵系统涉及多种工艺参数,各个参数的复杂变化均会影响系统的稳定性及沼气产量。同时,干发酵系统中的各参数间的内部相关性是高度复杂和非线性的,使得传统机器学习模型难以针对工业规模的车库式干发酵系统的沼气性能进行准确预测以及优化指导。


为了解决上述问题,中国石油大学(北京)新能源与材料学院李叶青副教授团队开发了一个基于自动化机器学习的新型智能系统(图1)。首先,智能系统使用多目标自动化机器学习模型准确预测消化池和渗滤液池的沼气性能。此外,根据最佳自动化机器学习模型,使用 SHAP 值分析数据的可解释性。其次,针对实际工厂数据考察最佳模型的预测准确性和预警性能。最后,基于MOPSO对产生预警的实际工厂数据进行优化,为未来干发酵工厂的性能改进提供指导。结果显示,对于两个反应池:消化池和渗滤液池,AutoGluon算法生成的堆叠集合模型均具有最高的沼气性能预测精度。可解释性分析表明,当消化池的温度在35-38℃范围内、每日喷淋时间约为10 min、压力为1000 Pa、原料为高总固体含量的生物质;渗滤池的温度在35-38℃范围内、液位为1500mm、pH值范围为8.0-8.1、总无机碳浓度>13.8g/L时,可以最大限度提升消化池和渗滤液池的沼气产量及CH4含量。可见,基于自动化机器学习算法能够深入探索工业规模车库式干发酵系统的变量内部相关性,并实现对沼气性能的精准预测和预警优化。


图1: 智能系统运行流程图


本研究基于工业规模的车库式干发酵系统的特点收集两个数据集(D1和D2)。D1中的输入变量包括消化池的10个参数:原料质量、压力、温度、喷淋时间、喷淋次数、原料固体含量、原料挥发性固体含量、沼渣固体含量、沼渣挥发性固体含量以及沼渣质量;输出变量为消化池的两个性能指标:沼气产量和CH4含量。D2中的输入变量包括渗滤液池的7个参数:温度、压力、液位、pH值、电导率、总无机碳和挥发性脂肪酸;输出变量为渗滤液池的两个性能指标:沼气产量和CH4含量。同时,将两个反应池中易于操作的实际生产条件重新建立了两个数据集:D3和D4。对上述数据集的缺失值样本进行筛选剔除。通过Pearson系数矩阵热图(图2a,b)展现了D1和D2数据集的内部变量相关性,结果显示多数变量间的线性关系较弱。


图2: 皮尔逊系数矩阵热图:(a)D1消化池数据和(b)D2渗滤液池数据。


基于两种广为使用的自动化机器学习算法(AutoGluon,H2O)来自动选择最佳模型。通过在60-1200 s时间范围内对众多模型进行模拟和预测,并利用决定系数(R2)和平均绝对误差(MAE)两个指标进行评估,最终锁定最佳模型。结果显示(图3),针对消化池和渗滤液池两个数据集,AutoGluon算法的堆叠集成模型WeightedEnsemble的预测精度远高于H2O算法模型,表现出了更好的泛化性。


图3:AutoGluon针对消化池和渗滤液池数据集的模型预测性能图


为深入探究变量的内部关系,采用SHAP值法评估消化池和渗滤液池两个数据集中的输入变量的特征重要性和部分相关性。结果显示(图4),温度、喷淋时间和压力是对消化池沼气产量影响最重要的特征,当温度处于35-38℃、每日喷淋时间约为10 min、压力为1000 Pa时可以最大程度的促进消化池沼气产量;温度、液位和pH值是对渗滤液池沼气产量影响最重要的特征,当温度处于35-38℃、液位为1500mm、pH值范围为8.0-8.1时可以最大程度的促进渗滤液池沼气产量。


图4:基于SHAP值法的消化池和渗滤液池数据集的输入变量的特征重要性和部分相关性图


为了验证智能系统在实际应用中的性能,本研究收集了独立于D1和D2的15个车库消化池数据和渗滤池数据,对基于系统开发的软件进行实际预测和预警(图5)。结果如图5b-e所示,使用平均绝对百分比误差(MAPE)作为预测误差的衡量标准。消化的沼气产量和CH4含量的实际预测误差为14.00%和4.93%,渗滤池的沼气产量和CH4含量的预测误差为7.81%和5.40%。结果表明,所开发的智能系统已经全面了解了车库干式沼气池中两个反应器的数据之间的内在关系,可以在独立数据中做出准确的预测。当设定车库干式沼气池的沼气产量和CH4含量的阈值分别为294 m3和50%,渗滤池的沼气产量和CH4含量的最低阈值为589 m3和50%时,结果如图5b-e所示,在红色矩形区域内。对于测试的小数据,智能系统可以100%准确地检测出低于最低阈值的异常生产状况,这表明智能系统可以对工厂的生产状况提供极其准确的预警,以便人员进行调整。此外,对于低于最小阈值的生产数据,分别根据第三和第四个数据对车库消化池和渗滤液池的运行参数进行了MOPSO多目标优化,成功的提供异常生产状况的指示。


图5:基于智能系统开发的软件截图与预测误差示意图


综上所述,对工厂规模的车库式干发酵系统进行性能预测和预警优化对提升系统的沼气产量至关重要。本研究基于最佳AutoGluon的堆叠集成模型开发了新型智能系统,针对消化池和渗滤液池沼气性能实现了精准预测和预警优化。以下是本研究的主要贡献:


i). 将自动化机器学习算法模型用于干发酵系统领域,利用广泛数据对众多模型进行模拟与预测,算法自动选择最佳模型。

ii). 评估了各个模型的性能,得到了适用于干发酵系统的最佳AutoGluon的堆叠集成模型WeightedEnsemble,取得了优秀的精度性能。

iii). 采用SHAP值法对消化池和渗滤液池数据集的变量进行了可解释分析,以获得工艺参数的最佳组合来提高干发酵系统的沼气性能。

iv). 基于测试数据,智能系统检查异常生产条件的准确率为100%,并可以提供基于MOPSO的工艺优化指导。

v). 开发了基于智能系统的软件(预测误差小于15%),以支持后续研究人员和工厂人员进行实际应用(图5)。


相关论文发表在ACS ES&T Engineering上,中国石油大学(北京)硕士研究生张一和赵云共同为文章的第一作者,中国石油大学(北京)李叶青副教授为通讯作者。


扫描二维码阅读英文原文

ACS EST Engg. 2023, ASAP

Publication Date: May 26, 2023

https://doi.org/10.1021/acsestengg.3c00079

Copyright © 2023 American Chemical Society

点击“阅读原文”

你“在看”我吗?


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/157936