天然有机质 (NOM) 广泛存在于水体、沉积物和生物体中,其纳米超分子自组装对污染物的迁移转化和生态效应具有深远影响。然而,由于 NOM 超分子自组装结构的复杂性、污染物的多样性以及环境条件的多变性,传统实验方法难以全面解析其自组装机制及其对环境地球化学过程的影响。
随着大数据时代的到来,机器学习 (ML) 作为一种强大的数据分析工具,能够快速处理海量数据,揭示隐藏在复杂环境中的超分子自组装规律,为 NOM 的环境地球化学研究带来新机遇。
论文简介
近日,浙江工业大学潘响亮教授、张道勇教授 和 张明副教授 带领研究团队发表了一篇综述文章。该综述为 ML 在 NOM 超分子自组装研究中提供了数据源确定、算法选择、模型构建、可解释性分析的系统性指导,并总结了关于 ML 在 NOM 纳米自组装过程、结构和环境地球化学行为等方面的最新进展。此外,团队还提出了基于 ML、实验和理论化学计算相结合的研究框架,旨在通过 ML 全面、高效地理解 NOM 超分子自组装机制及其环境地球化学行为。
Figure.Research proposal of coupling ML, experiments and theoretical simulation to elucidate or predict NOM supramolecular nano-assembly and relevant environmental geochemical processes
这篇综述文章提出了多个创新观点。首先,文章强调了 ML 在处理多尺度、多模态数据方面的优势,尤其是结合纳米亚微米级空间化学分析技术(如 AFM-IR-mapping、Raman-mapping 等)所获得的分子相互作用和结构可视化信息,为揭示 NOM 自组装机制提供了有力的数据支持。其次,文章指出可解释的监督学习模型是理解 NOM 超分子自组装规律的关键,因为它们能够量化结构-性质-效应之间的关系,并弥合数据驱动的 ML 与实际环境应用之间的差距。此外,文章特别讨论了 ML 在解析 NOM 超分子自组装对污染物在多相环境介质的迁移转化(如氧化还原过程和沉降)、污染物生物有效性和地球元素转化(碳循环、水体富营养化等)的必要性和挑战。
该评论性综述以“Advancing micro-nano supramolecular assembly mechanisms of natural organic matter by machine learning for unveiling environmental geochemical processes”(《利用机器学习推动天然有机质微纳米超分子自组装机制及其环境地球化学过程的研究》)为题,发表在英国皇家化学会期刊 Environmental Science: Processes and Impacts。该工作得到了国家自然科学基金面上项目和浙江省“领雁”研发攻关计划的支持。
论文信息
Advancing micro-nano supramolecular assembly mechanisms of natural organic matter by machine learning for unveiling environmental geochemical processes
Ming Zhang, Yihui Deng, Qianwei Zhou, Jing Gao, Daoyong Zhang*, Xiangliang Pan *(潘响亮,浙江工业大学)