• 美文
  • 文章
  • 散文
  • 日记
  • 诗歌
  • 小说
  • 故事
  • 句子
  • 作文
  • 签名
  • 祝福语
  • 情书
  • 范文
  • 读后感
  • 文学百科
  • 当前位置: 柠檬阅读网 > 范文 > 正文

    基于iCEEMDAN和迁移学习的锂离子电池SOH估计*

    时间:2023-02-17 11:30:07 来源:柠檬阅读网 本文已影响 柠檬阅读网手机站

    杨淞元 田 勇 田劲东,

    (1.深圳大学物理与光电工程学院 深圳 518060;
    2.人工智能与数字经济广东省实验室(深圳) 深圳 518132)

    随着人们对低碳高效出行需求的日益增加,加强对新能源汽车的战略发展势在必行。作为新型清洁能源的代表,锂离子电池具有能量和功率密度高、循环寿命长、环境友好等优点,但其在安全性等方面仍有不足;
    如何保证锂离子电池安全、高效利用已成为一项重要课题。健康状态(State of health, SOH)表征了锂离子电池性能的退化程度,准确估计电池SOH具有重要的应用价值与现实意义。现有 SOH估计方法主要可分为基于模型的方法[1-3]与基于数据驱动[4-12]的方法。基于模型的方法需要针对性地建立电池机理模型,结构复杂且适应性和扩展性较差;
    基于数据驱动的方法仅依赖从电池原始充放电数据或从中提取的健康特征完成模型映射,无需涉及电池内部复杂的电化学机理,应用前景广阔。数据驱动方法的准确性和可靠性主要依赖于模型训练使用的原始电池数据及从这些原始数据中提取的健康特征的质量,数据质量对数据驱动方法中预训练模型的性能有着直接的影响。正确、完整、丰富的数据样本是利用数据驱动方法构建准确模型的重要基础。然而,锂离子电池规格多样、单体不一致、工况随机、循环寿命长,难以得到丰富的全工况、全生命周期的电池老化测试数据;
    另外,实际应用中由于电池管理系统(Battery management system,BMS)电量区间的保护性限制以及用户的不可控充放电行为,无法获得完整周期的电池充放电数据;
    再者,受 BMS采样速率和存储空间限制,数据往往会比较稀疏。这些因素最终都会导致小样本数据问题,降低了数据质量,进而导致数据驱动模型可靠性及精度降低、泛化能力差。因此,研究如何在小样本数据情境下采用数据驱动方法准确估计SOH至关重要。

    高质量的健康特征是利用数据驱动方法实现高精度 SOH估计的关键。由于电池放电过程复杂多变、可控性较差,因此从电池充电曲线中提取健康特征更为可行,可重复性更高。充电曲线通常又可分为恒流(Constant current, CC)充电阶段和恒压(Constant voltage, CV)充电阶段。为了提高健康因子质量,现有方法通常从完整的充电曲线中提取健康特征[13];
    但是在实际工况中,可获得的电池充电曲线往往是不完整的,所以此类方法也难以适用于在线估计;
    也有部分研究仅从 CC充电曲线提取特征[14],但仍然选取了完整的CC充电区间片段进行特征构建。因此需要选取能够真正代表实际应用中小样本数据区间的电池片段进行健康特征构建。

    数据驱动的 SOH估计方法需要可靠的神经网络进行模型构建,其中常见的网络有高斯过程回归(Gaussian process regression, GPR)、长短期记忆网络(Long short-term memory, LSTM)、BP神经网络(Back-propagation, BP)等[5-7]。GPR模型预测精度高,且为概率预测形式,但其计算复杂度较高,且WANG等[8]在研究中指出基于 GPR模型的单核函数捕捉电池老化过程的能力有限,难以满足不同老化趋势电池SOH估计的精度要求。LSTM网络具有适应性好、可移植性强等优点,在故障诊断和预测领域都得到了广泛的应用。TAN等[14]采用LSTM网络建立锂离子电池健康状态估计模型,并通过迁移学习,提升了模型对于不同工况、不同批次锂离子电池SOH估计的精度。BP网络结构简单,具有一定的自学习及推广概括能力,且易于迁移。MA等[9]针对电池的非线性问题,利用改进粒子群优化反向传播神经网络(BPNN)进行SOH估计和RUL预测,解决了电池的非线性问题,证明了该网络在SOH估计领域的优越性。

    尽管通过提取高质量的健康特征并选择性能优越的数据驱动模型可以提升SOH的估计精度,但对于小样本数据问题导致的原始数据质量下降,还需要对所提取特征数据进行更深入的分析与处理,以增强健康特征与电池退化的相关性,进一步提升数据质量。由于电池在全生命周期中表现出容量总体衰减和局部再生的老化特点,且二者之间的数值存在数量级上的差距。因此,如果将连续退化趋势与局部再生进行分离能够更有效地保留微小的局部特征信息,并提纯出全局退化趋势信息,将有助于提高特征信息的精确度。

    针对以上问题,本文提出了一种基于特征模态分解和迁移学习的锂离子电池SOH估计方法,其实现流程如图1所示。首先,利用片段CC充电电压曲线模拟小样本数据情境来构建健康特征,并通过改进的自适应噪声完备集合经验模态分解(Improved complete ensemble empirical mode decomposition with adaptive noise, iCEEMDAN)方法将健康特征分解为本征模态分量与残余分量,分别对应电池容量的全局退化和局部再生特征;
    然后,将分解后的两部分特征分别通过 LSTM网络和 BP神经网络进行训练,构建组合估计模型;
    最后,通过迁移学习将模型迁移到新的电池数据集,从而实现高精度SOH估计。基于NASA公开电池数据集的试验结果,验证了本文提出方法对于提高小样本情景下SOH估计精度的有效性,以及在同类型、不同单体电池之间的迁移能力。

    图1 本文所提方法流程图

    2.1 小样本电池数据来源

    本文所用数据集选取了 NASA Battery Aging ARC-FY08Q4中的B5、B6、B7号电池数据[15],试验在室温24 ℃环境中进行,首先以1.5 A的CC模式进行充电,当电池电压达到4.2 V时,以CV模式继续充电至充电电流降至20 mA;
    放电时以2 A的CC模式进行放电,直至B5、B6和B7的电压分别降至2.7 V、2.5 V和2.2 V。

    为模拟实际应用电池数据采集过程中不可避免的小样本数据问题,本文对选取的数据集进行了片段截取。对于小样本数据情境下的曲线区间选择,FAN等[16]进行了相关分析,结果表明3.8~4.1 V电压片段最能代表电池的退化特征。在此参考基础上,本文还考虑了片段所包含退化信息的完整性、片段不易在采集过程中出现数据缺失、片段在日常应用充电习惯中覆盖率高等截取标准,并针对所选用电池数据集的特征进行了综合考量,最终所选区间为3.94~4.10 V。

    2.2 健康特征构建

    囿于小样本数据的体量限制,会造成数据驱动估计方法精度降低,因此对健康特征的精确度要求更高。在小样本数据情境下,所有的健康特征都应通过所截取的CC充电电压曲线片段来构建;
    除了较为明显的片段区间容量、充电时间这些包含了显著退化信息的特征外,本文还将单位时间内电压升和容量增量(Incremental capacity analysis, ICA)曲线引入健康特征构建;
    ICA曲线描述了电池在单位电压下充入或放出的电量大小,单位时间内电压升描述了CC充电过程中电压的上升速率,二者将电压分别与时间及容量结合起来,实现更全面、可靠性更高的特征构建。基于上述分析,本文构建了5组健康特征,具体如表1所示。

    表1 健康特征定义

    目前,多采用容量、内阻和循环次数等方面来定义电池SOH;
    本文中电池SOH被定义为当前最大可用容量与该电池额定总容量的比值

    式中,Qcur为电池当前的最大可用容量;
    QN为电池的额定容量。

    为了定量评价所构建健康特征的质量,本文采用Pearson相关系数来评价健康特征和SOH之间的相关性。Pearson相关系数计算如下

    健康特征与本文选取电池数据集 SOH的Pearson相关系数如表2所示,可知所构建的5组健康特征数据在三个电池数据中均具有强正相关性;
    其中特征F1、F2和F4与SOH的相关系数均在0.98以上。

    表2 健康特征与SOH的Pearson相关系数

    2.3 iCEEMDAN与健康特征优化

    本文利用 iCEEMDAN对健康特征进行分解优化,得到健康特征的本征模态分量与残余分量。iCEEMDAN是经过改进的经验模态分解(Empirical mode decomposition, EMD)方法,由COLOMINAS等[17]提出,其解决了传统EMD方法模态混叠问题,同时在自适应噪声完备集合经验模态分解(Complete ensemble empirical mode decomposition with adaptive noise, CEEMDAN)的基础上解决了残留噪声与伪模态问题,减少了无用的模态分量,已被成功应用于时间序列预测。LIANG等[18]通过iCEEMDAN将原始黄金价格分解为不同层次的分量,再利用长短期记忆、卷积神经网络和卷积注意模块(LSTM-CNN-CBAM)联合组成的网络预测所有分量,证明了分解后的时间序列分量在模型预测精度方面优于未分解时间序列分量。HE等[19]将高校实际用电功耗数据通过 iCEEMDAN分解为一系列具有明显差异的模式,然后使用贝叶斯优化的LSTM 网络分别预测每种模式,实现了更精准的预测,也证明了经验模态分解对于复杂时间序列数据分析的可行性。

    iCEEMDAN为待分解信号添加了有权值的白噪声经验模态分量,如图2所示,其中,x[n]为待分解信号,wm[n]为具有零均值和单位方差的高斯白噪声信号,ε为白噪声添加的权值;
    定义算子Ej(·)求解信号EMD分解的第j个IMF分量,算子M(·)求解信号的局部均值。iCEEMDAN分解过程如下。

    图2 iCEEMDAN流程图

    (1) 对原始信号x[n]加入有权值的白噪声信号EMD分量,得到第一个残差信号

    (2) 原始信号减去第一个残差即可得到第一个IMF分量,

    (3) 对r1[n]加入有权值的白噪声信号 EMD分量,得到第二个残差信号及 IMF分量,

    (4) 第2,3,…,k个残差和IMF分量的计算方法同步骤(3),最终所得残差信号为Res分量。

    以NASA B5电池数据的特征F1为例,其经过分解后的本征模态分量与残余模态分量如图3所示。可以看出,经过优化后的特征量被分解为4个本征模态分量(IMF1-IMF4)和一个残余分量(Res),其中本征分量呈现出一定的局部再生特征,但与SOH所表现的全局退化趋势并没有明显的相关性;
    残余分量与 SOH相比缺少了小范围数据抖动,但其能清晰简明地捕捉整个循环过程SOH的退化趋势。

    图3 B5电池原始及iCEEMDAN分解后的健康特征F1、SOH曲线

    通过 iCEEMDAN将波动趋势与退化趋势有效分离,避免了在后续建模过程中两种携带不同退化信息的数据相互干扰,有效地实现了健康特征的优化。

    经 iCEEMDAN优化后的健康特征可简要分为本征模态分量与残余分量两部分,本征模态分量代表了电池退化的局部再生趋势,量级较小且具有一定的时序特征;
    残余分量则代表了电池的整体退化趋势,呈现出明显的单调特征。由于两种分量包含了不同的特征信息且具有不同的变化规律和数值量级,如果将其不加以区分地采用同一神经网络进行模型训练,则难以兼顾二者的差异性,并导致特征混淆。因此应当选取适合各自特点的网络进行模型训练,充分利用两类分量所包含的不同特征信息,以提高模型精度。

    本文选取 BP神经网络对残余分量进行训练,BP网络具有较强的非线性映射能力,能较好拟合趋势数据;
    选取LSTM网络对本征模态分量进行训练,LSTM 网络具有短期记忆能力,可以捕捉长期效应[20],使其非常适合时间序列预测。

    3.1 长短期记忆网络(LSTM)

    长短期记忆网络是一种特殊的循环神经网络,其引入门控制结构,通过控制输入门、遗忘门、输出门实现信息记忆和遗忘。其中,输入门决定当前时刻保存至单元状态的数据

    遗忘门决定需要保留到当前时刻的单元状态

    输出门控制单元状态输出多少信息

    LSTM的门控结构有效避免了梯度消失问题,适合时间序列数据的分析,LSTM 网络基本单元结构如图4所示。

    图4 LSTM基本单元结构

    3.2 BP神经网络

    BP神经网络是一种多层前馈神经网络,通过反向传播误差,依次从输出层经过隐藏层到达输入层,反复调整层与层之间的权重量和偏置量,从而实现误差函数值最小化的目的。权重量和偏置量的更新公式如下

    式中,w为更新权重值;
    b为更新偏置值;
    E为误差函数;
    η为学习率,通常取0.1~0.3;
    a为神经元输出值,可以看出权重与偏置的更新主要依赖于δ,而δ为误差函数对神经元输入值求偏导后的值,通过数学转换后本层的δ值可由下一层权重值和神经元输出值计算得出,因而可以实现权重量与偏置量的整体更新。

    对本征分量和残余分量分别采用不同的网络进行网络训练可以避免不同类型特征数据混叠对SOH估计的干扰,且充分利用了各个特征分量包含的信息,提升了训练所得基础模型的质量,能够有效提高估计准确度。

    3.3 模型迁移

    实际应用中,锂离子电池数据往往具有不同类型、不同单体、不同工况等多种区别。如何构建具有较高适应性与扩展性的模型并实现向不同电池数据集的迁移至关重要。

    迁移学习是一种类似于知识迁移及归纳研究的机器学习方法,其原理基于卷积神经网络在浅层学习特征的通用性。当目标任务数据量不足时,通过迁移学习将具有通用性的特征从已训练好的基础模型中迁移至目标任务,可以提升目标任务的训练效果,其中被迁移领域称为源域、迁移领域称为目标域。迁移学习通过学习已有的源域数据信息,将其利用在与其相似但不同的目标域中,从而避免从头开始训练学习新任务,并减少对大量训练数据的需求。

    迁移学习按学习方法可分为基于样本的迁移学习、基于特征的迁移学习、基于模型的迁移学习和基于关系的迁移学习。本文采用基于模型的迁移学习方法,即在源域和目标域中迁移相关的模型参数,通过源域训练好的模型参数优化目标域模型,从而提升目标域模型的精确度。

    迁移学习的关键是把握源域与目标域之间的内在相似性,例如,对于不同的电池数据,尽管存在局部退化差异,但是整体的退化趋势等关键信息存在一定的相似性。本文选取了NASA的公开电池数据集B5和B7分别作为迁移学习源域与目标域电池数据集,通过源域数据训练得到基础模型后,对模型进行参数更新,以适应目标域电池数据。

    本文算法实现采用的计算机主要配置如下:Intel Core i7-10700(2.90 GHz)CPU,16GB RAM和Microsoft Windows 10操作系统。模型构建语言环境为 Python3.9.5,TensorFlow版本为 2.9.1,keras版本2.9.0。

    4.1 基础模型训练与测试

    本文针对性地选取LSTM网络与BP网络对健康特征的不同分量进行机器学习建模。为验证所构建模型的有效性,本文选取NASA B5数据集提取的特征数据作为训练集,NASA B6数据集提取的特征数据作为测试集。

    本文共进行了5组对照试验,分别是用提取的原始健康特征直接通过 LSTM 网络训练估计SOH(对照组 1);
    用提取的原始健康特征直接通过BP网络训练估计SOH(对照组2);
    对原始健康特征进行 iCEEMDAN优化后将本征量与残余量全部通过LSTM网络训练估计SOH(对照组3);
    对原始健康特征进行 iCEEMDAN优化后将本征量与残余量全部通过BP网络训练估计SOH(对照组4);
    以及本文所采用的对原始健康特征进行 iCEEMDAN优化后将本征量通过LSTM网络,残余量通过BP网络训练综合估计SOH的方法。

    试验结果如图5所示,其中图5a~5d分别代表对照组1、2、3、4,图5e为本文所提出的方法。表3列出了各种方法在NASA B6电池数据中的误差统计结果,包括方均根误差(Root mean squared error,RMSE)、平均绝对百分比误差(Mean absolute percentage error, MAPE)、平均绝对误差(Mean absolute error, MAE)和决定系数(Coefficient of determination,R2),其公式定义如下

    图5 不同方法的SOH估计结果

    对比图5a和图5b可知,未进行 iCEEMDAN优化时,LSTM网络与BP网络估计效果较为接近,但 BP网络对于局部波动信息的学习能力不足,LSTM 网络对整体退化趋势的学习存在一定的偏差;
    由图5c和图5d可知,如果对iCEEMDAN优化后的健康特征采用相同的网络进行训练,一方面会使得本征量与残余量相互干扰,另一方面由于特征维数增加,使网络对重要特征的权重分配不足,因此会造成估计精度甚至低于不进行优化的对照组1和对照组2;
    本文所提出的方法在保证整体趋势估计精度的同时,也较好地还原了退化过程的局部波动现象。对比表3中的各项误差数据可知,在相同运算条件下,本文所提出的方法均具有最高精度。

    表3 不同方法的SOH估计误差

    4.2 模态分解方法比较

    为了进一步验证本文所采用的改进型经验模态分解方法的优越性,本文对所构建特征分别进行EMD、CEEMDAN和iCEEMDAN分解,再分网络训练,同样选取NASA B5数据集提取的特征数据作为训练集,NASA B6数据集提取的特征数据作为测试集,结果如图6所示,误差统计如表4所示。可以看出,EMD分解由于存在模态混叠问题,即一个单独的IMF分量中含有不同的时间尺度,使得所分解特征信息估计效果较差;
    CEEMDAN分解方法一定程度上解决了模态混叠问题,估计效果相比EMD有所提升,但其会产生残留噪声以及伪模态分量,造成趋势估计结果的偏移;
    本文所采用的iCEEMDAN模态分解方法能够保留关键特征信息,并去除了残留噪声以及伪模态,具有更好的估计效果。

    图6 不同经验模态分解方法的SOH估计结果

    表4 不同分解方法的SOH误差

    4.3 模型迁移与测试

    为评估本文所构建的基础模型在不同数据集上的迁移能力,选取B7电池数据集进行测试分析。B7电池的前 30%数据用作模型微调的训练集,后 70%数据用作迁移模型的测试集,结果如图7所示。其中图7a为本征模态分量的估计结果,图7b为残余分量的估计结果,图7c为将图7a与图7b相加后得到的最终SOH估计结果。估计误差统计如表5所示。对比图5和图7可知,由于模型迁移后选取了迁移数据集中前30%的数据对模型进行微调,而构建基础模型时分别选取了两组不同电池数据(B5与B6)进行模型的训练与测试,因此模型迁移后的精度更高,其方均根误差仅为 0.016。上述结果表明本文所构建的基础模型对于同一类电池数据集具有较好的可迁移性。

    图7 基础模型对B7电池数据的迁移学习结果

    表5 迁移学习模型的SOH误差

    本文研究了基于 iCEEMDAN分解和迁移学习的小样本数据情境下的锂离子电池 SOH数据驱动估计方法。主要工作和结论如下所述。

    (1) 将 iCEEMDAN应用于健康特征优化,对SOH的局部再生现象及全局退化趋势进行分离。

    (2) 提出了多网络组合构建模型的方法,根据分离后健康特征数据的不同特点,选取LSTM网络和BP神经网络进行网络模型构建,并选用B5电池数据集进行模型训练,在B6电池数据集下的RMSE误差为0.030 5,R2系数为0.987 4。

    (3) 将所构建的基础模型迁移至 B7电池数据集,并采用前30%数据对模型参数进行微调。结果表明,由于采用相同电池数据集中的部分数据对模型参数进行了微调,迁移模型具有更高的精度,RMSE误差为0.016 8,R2系数为0.997 2。

    本文证明了所构建的模型在同类型、不同单体电池数据样本较小情况下的有效性。在未来的研究工作中,我们将进一步验证本文方法在不同类型电池之间迁移的性能。

    猜你喜欢 分量模态神经网络 基于BERT-VGG16的多模态情感分析模型成都信息工程大学学报(2022年4期)2022-11-18多模态超声监测DBD移植肾的临床应用昆明医科大学学报(2022年3期)2022-04-19跨模态通信理论及关键技术初探中国传媒大学学报(自然科学版)(2021年1期)2021-06-09神经网络抑制无线通信干扰探究电子制作(2019年19期)2019-11-23一斤生漆的“分量”——“漆农”刘照元的平常生活当代陕西(2019年19期)2019-11-23一物千斤智族GQ(2019年9期)2019-10-28基于神经网络的中小学生情感分析电子制作(2019年24期)2019-02-23论《哈姆雷特》中良心的分量英美文学研究论丛(2018年1期)2018-08-16基于神经网络的拉矫机控制模型建立重型机械(2016年1期)2016-03-01基于支持向量机回归和RBF神经网络的PID整定海军航空大学学报(2015年4期)2015-02-27
    相关热词搜索: 迁移 锂离子电池 估计

    • 文学百科
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章