4月28日,华中科技大学谢鹏超教授课题组在ACS ES&T Engineering发表了题为“Innovative Feature Engineering Driven by Chemical Category in Machine Learning for Optimizing the Prediction of Hydroxyl Radical Reaction Rate Constants”的研究论文,通过将分子描述符(MFs)与化学类别特征相结合,本研究提出了一种先进的机器学习(ML)框架用于预测羟基自由基反应速率常数(kHO•)。

羟基自由基(HO•)凭借其高反应活性和广谱氧化能力,在高级氧化工艺(AOPs)中发挥着关键作用,被广泛应用于有机污染物降解,特别是水处理和环境修复领域。AOPs的效能主要取决于HO•与不同有机污染物的反应速率,因此准确预测羟基自由基反应速率常数(kHO•)对工艺优化至关重要。由于污染物与HO•的反应活性是决定降解效率的关键因素,理解和预测kHO•对于提升AOPs性能、开发更具成本效益的环境修复策略具有基础性意义。精确测定反应速率常数对于选择合适的AOPs工艺及评估其实际应用价值十分关键。传统上主要通过实验方法测定kHO•值,但这些方法往往耗时耗力,且需要复杂的实验装置。这些局限性凸显了对替代方法的需求,这些方法应能在降低实验成本和时间的同时准确预测kHO•。定量构效关系(QSAR)模型因其能有效关联分子结构与反应活性,逐渐成为预测kHO•的主流方法。然而随着分子相互作用复杂性和污染物数量的增加,传统QSAR模型在预测kHO•时的准确性和适用性已显现出明显局限。
本研究首次提出融合分子指纹与化学类别特征的机器学习预测框架,通过创新性特征工程方法系统优化特征选择与编码策略,显著提升了预测精度与泛化能力。测试集上对HO•与有机物反应速率常数的预测结果达到R²=0.9794、均方根误差0.1313的优异性能。该框架不仅能捕捉不同有机类别的反应活性规律,还可解析驱动HO•反应的关键分子特征与类别因素。通过可解释性分析识别出影响反应活性的关键特征,既揭示了有机污染物的行为机制,也增强了模型的透明度。本研究为有机物降解动力学建模建立了可靠方法基础,其准确预测HO•反应速率常数的能力将有力促进水质管理与污染控制领域的技术发展。
声明:本公众号仅用于分享前沿学术成果,无商业用途。如涉及侵权,请联系公众号后台删除!