Py学习  »  机器学习算法

机器学习顶刊汇总:Nat. Rev. Chem.、EnSM、ACS Nano、npj Comput. Mater.、CM等成果

微算云平台 • 1 年前 • 163 次点击  

【做计算 找华算】理论计算助攻顶刊,10000+成功案例,全职海归技术团队、正版商业软件版权!

1. IF=34.035! Nat. Rev. Chem.概述化学科学中机器学习工具的评估指南
机器学习(ML)有望解决化学领域的重大挑战,并加快研究假设的生成、改进和排序。尽管ML的工作流程具有总体适用性,但当前ML评估技术和指标的异质性导致难以比较和评估新算法的相关性。最终,这可能会延缓化学的大规模数字化,并使开发、实验人员、审稿人和期刊编辑感到困惑。
为此,葡萄牙里斯本大学Tiago Rodrigues等人批判性地讨论了一套针对不同类型的基于ML的出版物的方法开发和评估指南,重点强调了监督学习。作者提供了来自不同研究人员和化学学科的各种示例,在考虑不同研究组的不同可访问性的同时,建议侧重于报道完整性和工具之间的标准化比较。作者希望通过提出回顾/前瞻性测试清单并剖析其重要性以进一步提高ML透明度和可信度。具体来说,作者讨论了特定支撑实验的相关性,并分析了“该做和不该做”。通过推荐广泛适用的指南,旨在提高对专注于化学科学中新概念、基准或新发现的ML出版物的期望。考虑到实用性、问责制和易于执行性,本文的建议分为不同的类别:1)数据/代码报告;2)回顾性评估;3)与基准比较;4)前瞻性评估和模型解释,从而提高三种ML研究类型中每种方法的质量、可转移性和重用性。
图1. ML中的回顾性评估
作者希望ML能够加快化学科学的进步,并完全独立于人为干预或作为专家推理的助手。随着为应对特定挑战而开发的ML方法数量的增加,统一的标准程序在短期内十分必要。作者建议,每种手稿类型都需要不同的评估研究,如在某些情况下可能需要进行彻底的前瞻性评估,但在其他情况下则不需要。此外,将评估与真正的ML前瞻性验证分开是关键,在短时间内几乎不可能进行适当的验证且只能通过多次迭代、经过大量和多年研究来实现。考虑到这一点,作者构建并讨论了化学科学中ML的推荐回顾/前瞻性评估研究列表,并重申了没有通用的方法,每个ML实施都可能需要特定的调查和控制,这在拟议的研究中施加了一定程度的灵活性。总之,ML评估指南是化学科学界亟需的一步,作者也期待有吸引力的讨论和指南的持续更新。
图2. 根据稿件类型所需的评估研究总结
Evaluation guidelines for machine learning tools in the chemical sciences, Nature Reviews Chemistry 2022. DOI: 10.1038/s41570-022-00391-9

2. 陆盈盈/童哲铭EnSM: 混合集成学习模型预测考虑极化恢复的电池容量衰减
容量波动会显著影响电池放电容量的预测精度,引起波动的主要原因可能是当电池不再充放电时发生了电荷重新分配,然后电池倾向于重建新的电化学平衡状态。上述过程被称为极化恢复,它是一种显著影响锂离子电池(LIB)容量衰减行为的现象。
在此,浙江大学陆盈盈研究员、童哲铭研究员等人研究了极化恢复对容量波动的影响,以提高LIB放电容量的预测精度。研究表明,较长的弛豫时间可帮助电池保持较长的极化恢复阶段,使粒子分布均匀。此外,作者研究了弛豫时间、弛豫状态和健康状态(SOH)对LIBs容量波动的影响,并计算了Spearman秩相关系数和Pearson线性相关系数来分析不同参数之间的相关性。结果表明,可利用对容量波动有显著影响的参数来提高容量预测模型的准确性。为此,作者开发了一种基于双 LSTM网络、多元回归和蒙特卡罗模拟(MC)的混合集成学习(HEL)模型。其中,两个具有滑窗的“多对一(M2O)”结构 LSTM 网络作为容量预测方法的核心。同时,作者引入多项式回归模型以减少具有滑窗的M2O LSTM的累积误差,然后利用MC模拟和线性回归来检测容量波动并消除相应的误差。
图1. 被测电池不同参数之间的相关性分析
具体而言,作者基于包含23078个循环数据的两个LIB降解数据集(LFP:LiFePO4/石墨;NCA:LiNi0.8Co 0.15Al0.05O2/石墨)验证所提出的混合学习方法。分析表明,与简单的LSTM相比,HEL方法在RMSE和MAE方面的预测误差分别减少了80.15% 和82.30%,表明HEL方法显著降低了容量波动的影响。因此,所提出的HEL方法在预测和泛化性方面表现出令人满意的性能。与现有方法相比,该方法捕捉容量波动并根据健康指标进行更准确地描述。然而,仍需额外的实验来构建更广泛的电池数据集,以考虑未来温度和充放电倍率的影响。总之,本研究中开发的容量衰减模型在推进电池单元的SOH估计及在复杂运行条件下针对许多电池供电的存储系统增强寿命管理系统的设计方面显示出巨大的潜力。
图2. 基于HEL方法的六个样本的容量预测结果
Prediction of Li-ion battery capacity degradation considering polarization recovery with a hybrid ensemble learning model, Energy Storage Materials 2022. DOI: 10.1016/j.ensm.2022.05.026

3. 张杨松/蒲贤洁ACS Nano: 摩擦纳米发电机+深度学习实现颈部运动检测
颈部运动的状态反映了颈部的健康状况,检测人体颈部运动状态对医疗智能具有重要意义。实用的颈部运动检测器应该是可穿戴、柔性、节能和低成本的。
在此,西南科技大学张杨松副教授、重庆大学蒲贤洁等人提出了一种基于摩擦纳米发电机(TENG)的支持深度学习(DL)、可穿戴、亲肤、柔性、可拉伸、低成本且易于制造的颈部运动传感器。这种自供电颈部运动摩擦电传感器 (SNM-TS)最外层由四个固定在硅颈圈上的硅橡胶基摩擦电纳米发电机(S-TENG)组成,最内层由硅橡胶制成的颈圈作为基底。颈部运动会对传感器施加压力,导致S-TENG弯曲或拉伸。在屈曲过程中,电子通过外电路从碳/硅橡胶流向地面以保持静态平衡。当碳/硅橡胶和硅橡胶之间的距离最短时,二者之间的电位差最低。当颈部恢复到初始状态时,电子通过外部电路向后流动。电压波形的峰值为负,而在延伸过程中电流方向相反,电压波形的峰值为正,这是发电过程的一个完整周期。
图1. S-TENG的工作机理和性能
值得注意的是,作者在S-TENG和颈圈之间附加了碳掺杂硅橡胶层作为屏蔽层,可大大降低人体皮肤强正电位的影响从而提高信噪比(SNR)。基于此优化,当颈部处于特定运动状态时,四个通道输出的不同幅度/方向的电压信号是稳定的,从而可识别颈部运动状态。为了进一步提高识别率,作者设计了一个基于卷积神经网络(CNN)的DL模型来识别11类颈部运动,包括8个弯曲方向、2个扭转方向和1个静止状态。最终,获得了92.63% 的平均识别准确率。总之,柔性屏蔽层的设计和DL算法的应用为摩擦电可穿戴传感器的改进提供了参考。此外,除了颈部运动外,该传感器的结构和相关数据分析方案还可用于检测人体其他关节的运动,在医疗保健、康复和人机界面等领域具有广阔的应用前景。
图2. 集成DL辅助数据分析的颈部运动状态识别系统
Deep Learning Enabled Neck Motion Detection Using a Triboelectric Nanogenerator, ACS Nano 2022. DOI: 10.1021/acsnano.2c02149

4. 莱斯大学韩亦沫npj Comput. Mater.: 机器学习+4D-STEM揭示材料变形!
了解晶格变形对于确定纳米材料的特性至关重要,这在从能量收集到电子设备的未来应用中会变得更加突出。然而,揭示对大样本区域的材料特性产生关键影响的意外变形仍具有挑战性。
在此,美国莱斯大学韩亦沫教授等人展示了一种快速和半自动的无监督机器学习方法来揭示材料中的晶格变形,该方法利用分裂的层次聚类并使用四维扫描透射电子显微镜(4D-STEM)从衍射数据中自动揭示整个样品薄片中的多尺度变形。
数据采集后,作者使用以下3个主要步骤处理4D数据:预处理衍射图案、数据的层次聚类和结果可视化。预处理包括对齐和屏蔽衍射图案,该步骤有助于组织 4D数据集并从数据集中提取结构信息,同时避免由显微镜未对准和背景引起的任何歧义。此外,作者采用分裂的层次聚类架构来聚类4D数据集中的衍射图案。分裂式架构是一种自上而下的方法,它从整个数据集开始,然后在向下移动层次结构时递归地执行聚类。最后,由于每个衍射图案代表真实空间中的一个像素,因此可将聚类结果中的标签映射回真实空间以便更好地理解材料结构。
图1. WS2-WSe2超晶格上的聚类结果
作者已将这种方法用于从不同的2D横向异质结、更厚的3D材料和横截面晶体中提取特征,纯数据驱动的分析揭示了样品中不同类型的材料变形,如应变、晶格畸变、弯曲轮廓等。该方法演示了对4D-STEM数据的快速初始分析,并允许更轻松、更快地发现晶体样品中的意外变形。此外,作者还通过在具有随机初始聚类中心的同一数据集上运行100次该算法来评估K-means方法的精度。结果表明,88% 的总运行对这个连续特征具有75% 以上的准确度,表明该方法的可靠性。总之,结合高度精确的映射技术,该方法可能会导致朝着分析细微的晶格变形迈出关键一步。更重要的是,这种方法可能会扩展到更广泛的材料系统或其他生成大型多维数据集的成像技术,有利于未来材料、技术和应用的发展。
图2. 4D-STEM数据集中真实空间图像的聚类结果
Uncovering material deformations via machine learning combined with four-dimensional scanning transmission electron microscopy, npj Computational Materials 2022. DOI: 10.1038/s41524-022-00793-9

5. 维也纳大学npj Comput. Mater.: 机器学习用于探索小极化子构型空间
极化子缺陷普遍存在于材料中,在载流子迁移率、电荷转移和表面反应性等诸多过程中发挥着重要作用。因此,确定小极化子的空间分布对理解材料的性质和功能至关重要。然而,当使用第一性原理方法时,对构型空间的必要探索在计算上要求很高。
在此,奥地利维也纳大学Cesare Franchini等人提出了一种数据驱动的策略用于加速探索极化子构型空间。具体而言,作者提出了一个简单的核回归方案,其描述符体现了极化子-极化子和极化子-缺陷的相互作用,通过在最小DFT数据集上进行训练以评估初始(几百个)极化子构型的相对稳定性。然后,经过训练的机器学习(ML)算法可通过系统地分析数百万个构型来扩展对构型空间的探索,这远远超出了分子动力学(MD)或任何完全基于DFT的替代采样方法的限制。作者测试并讨论了以下替代协议:(1)传统的训练/验证/测试ML协议;(2)遗漏缺陷浓度模型,基于从在其他浓度获得的DFT能量推断给定缺陷浓度的极化子能量;(3)详尽的ML搜索。基于引导自下而上从每个给定缺陷浓度下的所有可能非等效构型中选择最有利构型的极化子构型空间的探索。
图1. 该方法应用于TiO2(110)时的结果
通过将此处提出的DFT+ML策略应用于具有不同类型缺陷(VO和Nb掺杂剂)的两种不同材料(TiO2(110)和SrTiO3(001))并采用不同策略构建DFT数据库(MD和随机抽样),作者发现随机抽样方法优于MD生成的数据库,后者在 MD生成的构型和过多的计算成本之间存在不良相关性。重要的是,随机抽样和穷举ML搜索的组合产生了一个稳健的算法。ML辅助搜索正确地识别了任意载流子密度(从稀到密极限)的基态极化子构型,正如对选定ML预测构型的基准 DFT测试所证实的那样。总之,该研究提出的方法可用来有效地确定不同极化子材料中的最佳极化子模式,并且可被训练来解释极化子与不同点状缺陷(氧空位和掺杂剂,还有间隙原子和吸附原子)的相互作用。
图2. 该方法应用于SrTiO3(001)时的结果
Machine learning for exploring small polaron configurational space, npj Computational Materials 2022. DOI: 10.1038/s41524-022-00805-8

6. 橡树岭实验室CM: 比DFT快六个数量级,机器学习预测状态密度!
材料的电子结构,如状态密度(DOS),提供了对其物理和功能特性的关键见解,并为许多材料筛选和发现工作流程提供了高质量特征的宝贵来源。然而,常见DFT计算 DOS的成本过于昂贵,因此需要更便宜但足够准确的替代方法。
在此,美国橡树岭国家实验室Victor Fung等人开发了一种基于图神经网络的通用机器学习(ML)方法,用于纯粹从原子位置预测DOS,比DFT快六个数量级。要使用ML将原子结构准确映射到DOS,需要一种对系统的完整组成和结构维度敏感的表示。作者使用基于图的系统表示,其中包含作为节点的原子和作为边的原子间距离作为图神经网络的输入模型以有效地捕捉组成和结构维度。该方法还与系统尺寸成线性关系,这允许对超大晶体或无定形系统进行DOS预测,只需对整体工作流程进行微小的更改。其他改进途径还包括更好的DOS输出表示,如使用主成分基础或使用自动编码器,只要重建误差足够低,这将有助于减少输出维度。或者,将ML预测耦合到物理模型,如紧束缚模型或Δ-ML方法中较低水平的DFT理论可用于提高准确性并减少数据需求。
图1. 图神经网络模型的总体示意图
进一步,作者还提出了一种通过附加损失函数应用物理约束的新方法,该方法用于通过自动微分训练模型以获得梯度。这种方法的一个优点是所需约束的灵活性,可在不修改工作流其余部分的情况下对其进行更改。同时,在训练数据有限的其他情况下,将功能空间限制为物理上有意义的解决方案的受限模型架构可能被证明是有益的。这种DOS预测方法在材料筛选和ML研究中特别有用,可获得计算成本低廉的电子特征,这些研究使用DOS作为输入来预测更复杂的功能性质。同时,该模型的快速度也使其适合于在MD模拟过程中提供电子结构信息或用于以数字孪生的形式实时告知实验的方法。随着包含DOS数据的计算数据集不断快速扩展,建立完全通用的固体电子结构ML模型的目标已经触手可及。
图2. 基于三个数据集曲线来研究模型的数据依赖性
Physically Informed Machine Learning Prediction of Electronic Density of States, Chemistry of Materials 2022. DOI: 10.1021/acs.chemmater.1c04252
TEM、球差云视频,加急测!
球差、冷冻电镜、原位TEM、HR-TEM、EDS-Mapping、SAED、HAADF-STEM、EELS、ABF-STEM应有尽有!
Science、Nature级别水平!发顶刊,拍TEM,找我们就对了!
添加下方微信好友,咨询宋老师:13612927057(电话同微信)

 点击阅读原文,提交计算需求!

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/137689
 
163 次点击