《储能科学与技术》文章|董作林等：基于模态分解和深度学习的锂离子电池寿命预测

作者：董作林 1,2,3 宋金岩 1,2,3 孟子迪 1,2

单位：1. 大连海洋大学信息工程学院；2. 设施渔业教育部重点实验室；3. 辽宁省海洋信息重点实验室

引用本文：董作林, 宋金岩, 孟子迪. 基于模态分解和深度学习的锂离子电池寿命预测[J]. 储能科学与技术, 2025, 14(4): 1645-1653.

DOI：10.19799/j.cnki.2095-4239.2024.0983

本文亮点：（1）采用集成经验模态分解与随机森林算法结合降低容量再生对预测结果影响；（2）使用去噪自动编码器对本征模态函数进行降噪处理，然后分别采用LSTM模型与Transformer模型对残差与本征模态函数进行建模。

摘要随着新能源汽车数量的快速增长，精准预测锂离子电池的剩余使用寿命(remaining useful life, RUL)对新能源汽车产业的持续发展起到了至关重要的作用。本工作提出了一种基于集成经验模态分解(ensemble empirical mode decomposition, EEMD)和深度学习的创新方法，旨在提升锂离子电池RUL的预测精度。首先，通过EEMD对电池容量数据进行多尺度分解，得到电池容量数据的全局退化趋势和局部随机波动分量。为了减轻噪声对模型预测精确度的干扰，引入去噪自编码器(denoising autoencoder, DAE)对随机波动分量进行降噪处理。随后，分别使用长短期记忆(long short-term memory, LSTM)网络和自注意力模型(Transformer)对全局退化趋势和降噪后的随机波动分量进行建模。最后为进一步提取各模态分量中存在的信息，采用随机森林(random forest, RF)算法计算各分量的重要性权重，根据得到的权重值对预测结果加权重构。本工作在美国国家航空航天局(National Aeronautics and Space Administration, NASA)公开的电池数据集上分别使用40%和60%的历史数据进行实验，结果表明所提出的方法在精度和有效性方面均优于现有方法，验证了其在锂离子电池RUL预测中的应用潜力。

关键词锂离子电池；寿命预测；深度学习；长短期记忆；随机森林

随着新能源汽车产业快速发展，新能源汽车的数量爆发式增长，锂离子电池在新能源汽车领域得到广泛应用，但是锂离子电池剩余使用寿命(remaining useful life，RUL)预测的准确性严重制约了新能源汽车产业的长久发展。因为当电池寿命降低到失效阈值后，电池稳定性明显降低，并且电池在一次完整充电周期内能提供的电量大幅度减少，使得其续航能力明显降低。此时应该及时更换电池，否则可能导致电子设备发生系统故障，进而引发火灾甚至爆炸等灾难性事故。因此，准确的RUL预测对预防车辆设备故障、保障系统正常运行与降低重大事故发生率具有重要意义。

近年来人工智能的兴起和计算机运算能力不断提高，使得基于数据驱动的锂离子电池RUL预测成为研究的热点。支持向量回归(support vector regression，SVR)因为有坚实的数学理论基础和良好的模型解释性，因此在早期常用来进行预测锂离子电池RUL。Nuhic等通过主成分分析法降低输入特征的维度，然后把降维后的数据作为SVR模型的输入，该方法提高了SVR短期预测的精度。You等采用粒子过滤(particle filter，PF)的期望最大化方法估计经验模型的隐藏参数，使用麻雀搜索算法(sparrow search algorithm，SSA)对SVR参数进行优化，并使用优化的支持向量回归方法对估计参数进行校正，该方法在保证预测性能的同时参数计算量更少。Chen等使用遗传算法(genetic algorithm，GA)对超参数进行了优化，并且用相空间重构(phase space reconstruction，PSR)选择最优输入序列，进一步提高了SVR算法的性能。与SVM类似，相关向量机(relevance vector machine，RVM)也是一种基于统计学习理论的机器学习算法，不过RVM是基于贝叶斯学习框架的，因此其提供了概率输出和对模型的自动稀疏化。Lyu等将GA算法整合到灰狼优化器(grey wolf optimizer，GWO)中，提出了一种优化算法GGWO来确定RVM中最优权重和核函数，建立了同步的电池健康状态(state of health，SOH)和RUL预测框架。RVM虽然在进行预测时计算量小、计算速度快，但是在进行长期预测时准确率较低。Guo等提出了一种基于最优相关向量和豪斯多夫距离修正退化模型的综合预测方法，该模型不仅在短期预测有效，而且提高了长期预测的准确性。不过考虑到电池容量难以直接测得，可以采用外部直接测量的健康因子(电压、电流)进行预测。

深度神经网络(deep neural network，DNN)是一种具有多个隐藏层的神经网络结构，这些隐藏层可以处理更高维度的特征，因此DNN能更好地处理复杂模式识别和预测任务。Venugopal等研究表明，卷积神经网络(convolutional neural network, CNN)具有处理网格结构数据的能力，能够准确预测电池容量，但是CNN在进行长期预测时存在准确性逐渐降低的问题。Park等使用长短期记忆(long short-term memory，LSTM)网络进行预测，并且与传统LSTM将输入层与输出层一对一匹配的结构不同，该方法采用电压、电流、温度三个维度特征，通过多对一的结构灵活处理各种输入类型，提高了模型的泛化能力，并且保证了模型在长期预测中的准确性。Xie等将CNN模型与LSTM模型结合提出了先验知识辅助CNN-LSTM模型来进行电池容量的实时预测。使用集成经验模态分解(ensemble empirical mode decomposition，EEMD)降低了电池容量再生现象对预测精度的影响，并且使得模型更具鲁棒性。

上述基于数据驱动的方法在锂电池RUL预测中实现了更高的精度预测，但仍然存在以下不足：①模态分解后的固有模态函数多为高频分量，包含的噪声会导致模型在预测时捕捉到非特征性信息，影响对容量趋势的精准把握；②模态分解后各分量代表了不同频率的信号特征，其中一些分量包含主要的容量衰减信息，而其他分量则可能主要由噪声或短期波动组成，简单融合方法无法有效区分各分量在预测结果中的重要性，从而使噪声较多的分量对最终预测结果产生影响。本工作提供了一种基于集成经验模态分解和深度学习网络的集成预测方法，以下是本工作的创新和贡献。

（1）采用EEMD算法将电池容量退化曲线分离为反映电池容量随机波动的固有模态函数(intrinsic mode functions，IMFs)和代表全局退化趋势的残差(residual，RES)，使用随机森林(random rorest，RF)算法得到每个固有模态函数对电池容量衰退曲线解释能力的权重。然后，将权重值分别与对应的神经网络模型预测结果进行加权重构，这样不仅降低了容量再生现象对预测结果准确性的影响，而且减小了波动分量对模型鲁棒性的影响。

（2）RES波动较小并且更加平滑，因此采用结构相对简单的LSTM模型对RES进行预测，来减少训练时间。IMFs存在大量的噪声，因此采用去噪自编码器(denoising autoencoder，DAE)对IMFs进行降噪重构，然后将重构序列输入自注意力模型(Transformer)，并且将降噪和预测这两个任务整合到一个框架中来节省训练时间。在统一框架下训练2000轮的时间为32.41 s，而将两个任务分开训练则耗时33.18 s，统一框架下训练效率提升约2.32%。

1 预测流程及理论背景

1.1　预测流程框架

本研究预测流程，如图1所示。该预测流程主要分为4个阶段：多尺度分解、DAE降噪、集成深度学习模型预测以及预测分量的加权重构。整个过程的具体步骤如下。

图1 预测流程图

（1）获取锂离子电池的容量数据。将时刻1到时刻t的容量数据用于训练集构建，而将时刻t+1之后的容量数据作为测试集，其中t表示当前时刻，随后对电池容量数据进行EEMD，将其分解为IMFs和RES。

（2）对IMFs进行去噪处理。IMFs主要为高频分量，这些分量中包含大量噪声，DAE作为一种无监督学习方法，能够有效提取有用特征。

（3）生成LSTM子学习器与Transformer子学习器，然后分别对RES和降噪后的IMFs进行建模，得到各分量的预测结果。

（4）使用RF算法得到各分量的权重值，提取各分量中的有用信息，再通过加权重构得到最终电池容量预测结果。

1.2　集成经验模态分解

经验模态分解(empirical mode decomposition，EMD)是一种广泛应用于非平稳信号分析的方法，常用于电池容量数据的分解。不过在进行EMD分解时，可能出现模态混叠现象，这会导致模态频谱的不清晰，从而影响分析结果的准确性。EEMD通过引入白噪声并对多次分解结果进行平均化，有效缓解了EMD在处理非线性和非平稳信号时的模态混叠问题。这一改进使EEMD成为一种更加具有鲁棒性的信号分解工具，广泛应用于各种信号分析和预测领域。通过对电池容量数据进行信号分解处理，EEMD能够有效降低容量再生现象对预测结果的影响。

1.3　随机森林

随机森林是一种集成学习方法，最早由Breiman提出，属于决策树的扩展，它通过构建多个决策树并结合其输出以提高预测的准确性和鲁棒性。随机森林通过以下4个核心步骤实现其功能。

（1）样本选择：随机森林使用自助采样法(bootstrap sampling，BS)从原始数据集中随机抽取多个样本子集，每个子集将用于训练一个独立的决策树。

（2）特征选择：在每个节点分裂时，随机森林从所有特征中随机选择一部分特征，而非使用所有特征，这样可以减少模型的方差，提高模型的泛化能力。

（3）决策树构建：对于每个样本子集，随机森林构建一棵决策树，每棵树通过节点的二元分裂进行训练，最终形成一个由多个节点组成的树结构。

（4）投票机制：在预测阶段，随机森林通过对所有决策树的预测结果进行投票或平均(对于回归问题)，最终确定输出结果。这一过程显著提高了模型的稳定性和准确性。

1.4LSTM模型

LSTM是一种功能强大的递归神经网络模型，具备优秀的记忆能力和处理长期依赖关系的能力。LSTM单元包含3个具有不同结构的控制门：遗忘门、输入门和输出门。这些门的设计旨在有效提取有用的长期信息，同时丢弃不必要的无关信息。其主要原理公式见式(1)~式(6)。

(1)

(2)

(3)

(4)

(5)

(6)

式中，

、

和

分别代表输入门、遗忘门、输出门和隐状态；

和

代表记忆元；

、

和

分别对应门与隐状态的系数矩阵；

、

和

分别为输入门、遗忘门、输出门和记忆元对应的偏置；

代表激活函数；

代表双曲正切激活函数。X_t为当前t时刻的输入数据，＊为逐元素(Hadamard)乘积。

LSTM内部流程，如图2所示。

图2 LSTM内部流程图

1.5Transformer模型

Transformer架构主要包括3个部分：编码器(encoder)、解码器(secoder)和位置编码(positional encoding)。编码器将输入序列编码成固定长度的表示，解码器则将这种表示解码成目标序列。编码器由多个编码器层(encoder layer)堆叠而成，每个编码器层包括以下两个子层。

（1）多头注意力机制，这个机制允许模型在不同的表示空间中关注输入序列的不同部分，其表达方法见式(7)。

(7)

式中，

、

和

分别表示查询(query)、键(key)和值(value)矩阵；

是键的维度。

多头注意力机制通过多个独立的注意力头进行计算，然后将这些头的输出拼接在一起并线性变换[式(8)、式(9)]。

(8)

(9)

式中，

和

是可学习的参数矩阵。

（2）前馈神经网络，每个位置上的注意力输出通过一个前馈神经网络进行处理，该网络包含两个线性变换和一个线性整流(ReLU)激活函数，表达方式见式(10)、式(11)。

(10)

(11)

式中，FFN为前馈神经网络(feed-forward network)，

、

和

是可学习的参数。

解码器的结构与编码器类似，但每个解码器层包括3个子层：带掩码的多头自注意力机制，防止解码器看到未来的位置；多头注意力机制，这部分与编码器的多头注意力机制相似，但查询矩阵来自前一个解码器层的输出，而键和值矩阵来自编码器的输出；前馈神经网络，与编码器中的前馈神经网络相同。

为了引入序列的位置信息，Transformer使用位置编码。位置编码是添加到输入嵌入(input embedding)中的，通常通过正弦和余弦函数定义[式(12)、式(13)]。

(12)

(13)

式中，PE为位置编码(positional encoding)，

表示位置；

表示维度索引，

是嵌入维度。

2 实验设计

2.1　数据集描述

本实验使用美国国家航空航天局(National Aeronautics and Space Administration，NASA)提供的锂离子电池公开数据集，选取第一组中编号分别为B0005、B0006、B0007和B0018四组电池作为研究对象，实验在恒定温度为24 ℃的环境下进行。

充电过程：采用恒流-恒压充电方法。在恒流阶段，电池以恒定的电流充电，直到电池电压达到设定的最大值。在此阶段，电流保持不变，而电池电压逐渐上升。随后进入恒压阶段，此时电池电压保持在设定的最大电压值不变，充电电流则逐渐减小，直到降至一个非常小的电流水平。

放电过程：在恒流条件下进行，即电池以恒定的电流进行放电，直到电池电压降至设定的截止电压2.5 V。在此过程中，电池电压会逐渐下降，直至达到截止电压。

本实验所选择的电池总容量为2 Ah。当电池容量衰减至原始容量的70%(即总容量降至1.4 Ah)时，视为电池寿命终止。四组电池的容量随充放电循环次数变化情况，如图3所示。

图3 NASA数据集电池容量退化曲线

2.2EEMD 分解

使用EEMD对电池B0005、B0006、B0007和B0018的容量数据进行分解，B0005模态分解结果，如图4所示。分解结果中的IMFs和RES共同构成了容量数据的完整表示。IMF1到IMF3为高频分量，这些分量提供了退化数据的频率成分和局部特征，但同时也包含了噪声和部分真实信息。RES包含了退化数据中的低频成分，代表了整体退化趋势。通过这种分解方法，能够更清晰地理解电池容量衰退过程中的不同特征，从而为后续的预测分析提供重要依据。

图4 B0005电池容量数据模态分解

2.3　随机森林回归

将IMFs作为输入特征，RES作为目标变量，进行随机森林回归分析。通过将IMFs输入模型，利用其包含的不同频率的信号信息，模型能够更加准确和稳定地进行预测。由于RES代表了电池容量数据的长期趋势，随机森林回归能够很好地处理这种平滑的趋势信号，减少模型对短期波动的过拟合现象。权重数值结果，如表1所示。

表1 随机森林回归结果

4组电池的拟合优度均在85%以上，表明模型的预测结果与真实值之间的误差较小，能够很好地拟合目标变量，并且不存在过拟合现象。将目标变量RES的权重数值设置为1，进而得到每个IMFs的权重系数，如表1所示。从表1中可以看出，不同分量的权重系数存在差异，这表明模型对不同特征的依赖程度不同。权重较大的分量对模型预测结果的影响更大，而权重较小的分量贡献较少。因此，有必要对分量的权重系数进行合理调整，以进一步优化模型的预测性能。

3 实验结果与分析

3.1　模型参数设置

本实验的模型有6个关键参数：学习率(λ)、隐藏层大小(s)、编码器层数(ι)、自注意力头(η)、优化器(θ)以及滑动窗口大小(б )。Adan优化器结合了自适应学习率和Nesterov动量，能够显著加速模型收敛，尤其在训练深度神经网络时，其收敛速度优于Adam和随机梯度下降(stochastic gradient descent，SGD)等传统优化器。此外，Adan对数据噪声具有较强的容忍性，这对包含容量波动和噪声的电池容量数据尤为关键，有助于在复杂数据条件下实现稳健的预测。因此，本实验在模型训练中选用了Adan优化器，以提高模型的收敛效率和鲁棒性。模型参数设置，如表2所示。

表2 模型参数设置

3.2　预测指标

为了对锂离子电池预测模型的性能进行评估，本工作引入相对误差(relative error，RE)、平均绝对误差(mean absolute error，MAE)、均方根误差(root mean square error，RMSE)和平均绝对百分比误差(mean absolute percentage error，MAPE)来分析和评价模型的预测结果。以下是这4个评价指标的定义[式(14)~式(17)]。

(14)

(15)

(16)

(17)

式中，

和

分别对应模型预测的电池容量和实际电池容量降低到规定失效阈值时的充放电时间；

和

分别表示预测电池容量和实际电池容量。

评价指标的值越小，表明模型的预测效果越好。

3.3　预测结果

本研究将EEMD-LSTM、DaTransformer、EEMD-LSTM-DaTransformer和本实验提出的EEMD-Rf-LSTM-DaTransformer混合模型进行对比。通过利用来自NASA数据集中编号为B0005、B0006、B0007和B0018的电池数据，对该预测模型的性能进行了验证。这一比较旨在评估不同方法在电池寿命预测任务中的效果，进而为电池管理系统的优化提供参考依据。

使用与所提出的混合模型相同的起点，图5显示了RUL的预测结果。可以看出，所提出的混合模型在预测容量再生现象方面表现出色，显著提高了RUL的预测精度。表3和表4展示了不同模型的预测误差。

图5 60%历史数据预测结果

表3 60%历史数据预测误差

表4 40%历史数据预测误差

具体而言，单独使用LSTM模型时，未能准确捕捉电池容量再生现象，导致显著的预测误差。而EEMD-LSTM-DaTransformer模型结合了信号的分解与DAE降噪，在有效捕捉容量再生现象的同时捕捉到了全局退化趋势。通过将RF与EEMD-LSTM-DaTransformer相结合，对IMFs进行加权处理，进一步减小了最终融合预测时IMFs对全局退化趋势的影响。这使得最终融合结果的波动性降低，并且可以捕捉到容量再生现象，证明了在分量融合过程中使用RF的有效性。

对于NASA数据集，本工作提出的方法在每组电池的预测中都表现出色。B0005、B0006和B0007号电池的RMSE分别为0.00913、0.00997和0.00740，此外，混合模型的MAE、MAPE指标同样最低，表明本工作提出模型的预测波动更小、精度更高。

为了检验模型在早期预测中的准确性，将起点更改为更早期阶段，预测结果如图6(a)、(b)和(c)所示。尽管DaTransformer在使用60%历史数据进行预测时表现出较低的误差，但在仅使用40%历史数据的情况下，模型的预测结果波动显著增大，平均RMSE达到0.01590，预测误差明显增加。本工作的方法仅使用40%的历史数据就能够准确捕捉容量再生现象，并且RMSE平均为0.01080。因此，该方法在早期预测方面同样表现出色，进一步验证了模型预测的有效性。

图6 40%历史数据预测结果

模型的泛化性指的是其在未见过的新数据上的表现能力。本工作使用B0018号电池对模型的泛化性进行验证，如图5(d)和图6(d)所示。由于B0018电池容量波动幅度较大，DaTransformer受容量再生现象的影响，导致其预测效果不佳且泛化能力较弱。而本工作提出的模型在预测精度上表现出显著优势，预测误差较小，表明该模型具有良好的泛化性。

4 结论

本工作提出了一种基于EEMD分解与深度学习模型相结合的锂离子电池RUL精确预测方法，旨在提升锂离子电池RUL的预测精度。该方法的主要步骤包括多尺度分解、降噪处理、建模以及加权重构。通过在NASA电池数据集上进行实验验证，结果表明该方法在预测精度和稳定性方面优于传统方法，并且在处理容量再生现象方面展现出显著优势。此外，本工作分别使用40%和60%的历史数据进行了测试，证明了该模型在不同数据量条件下良好的预测效果和泛化性。主要结论如下。

（1）通过EEMD算法，锂离子电池的容量数据可以被有效分解为具有不同尺度特征的分量。随后，采用RF算法对这些预测分量进行加权融合，有效降低了因容量再生和干扰因素引起的数据波动对预测精度的影响。

（2）根据各分量数据在多个尺度上的特点，利用LSTM模型和DaTransformer模型对全局退化趋势及各波动分量进行建模，从而解决了单一预测模型在精度和泛化能力上的不足。

（3）该模型在来自NASA的电池数据上进行了测试，结果表明模型能够准确预测电池容量，验证了该方法的有效性和适应性。

（4）在未来的工作中，将致力于改进该方法，以减少模型的训练时间，同时实现实时在线预测，并将其应用于实际环境中。

第一作者：董作林（2000—），男，硕士研究生，研究方向为电池寿命预测，E-mail：2900325200@qq.com；

通讯作者：宋金岩，副教授，研究方向为新能源器件制备与应用，E-mail：songjinyan@dlou.edu.cn。

基金信息：辽宁省自然科学基金指导计划（20180550573），大连海洋大学校级教改项目（32），辽宁省教育厅项目（JL201918）。

中图分类号：TM 912

文章编号：2095-4239（2025）04-1645-09

文献标识码：A

收稿日期：2024-10-21

修回日期：2024-11-23

出版日期：2025-04-28

网刊发布日期：2025-05-20

邮发代号：80-732

联系热线：010-64519601/9602/9643

投稿网址：http://esst.cip.com.cn/CN/2095-4239/home.shtml

《储能科学与技术》文章|董作林 等：基于模态分解和深度学习的锂离子电池寿命预测

1 预测流程及理论背景

1.1 预测流程框架

1.2 集成经验模态分解

1.3 随机森林

1.4LSTM模型

1.5Transformer模型

2 实验设计

2.1 数据集描述

2.2EEMD (adsbygoogle = window.adsbygoogle || []).push({}); 分解

2.3 随机森林回归