用于锂离子电池健康状态估计的先进机器学习技术:一项比较研究

目录

摘要

介绍

健康状态(SOH)估计

机器学习方法

支持向量回归(SVR)

高斯过程回归(GPR)

前馈神经网络(FFNN)

自适应神经模糊推理系统(ANFIS)

微调(Fine-tunning)

实验

特征提取

特征选择

均方根误差(RMSE)

穷举搜索(ES)

结果与讨论


摘要

锂离子(Li-ion)电池的健康状态(State-of-Health,SOH)的准确建模和预测对于延长其寿命、确保可靠性和最小化与广泛实验室测试相关的成本至关重要。本文研究了利用先进的机器学习(ML)技术进行Li-ion电池SOH估计。具体而言,使用恒流恒压(Constant Current Constant Voltage,CCCV)协议对三星INR18650–35E单元进行了600个循环。ML方法的输入数据是从充电和放电循环中提取的,以获得最佳结果。

采用不同方法基础的数据驱动模型预测SOH:高斯过程回归(Gaussian Process Regression,GPR)支持向量回归(Support Vector Regression,SVR),以及来自人工神经网络(Artificial Neural Networks,ANN)领域的前馈神经网络(Feed-Forward Neural Network,FFNN)自适应神经模糊推理系统(Adaptive Neuro-Fuzzy Inference System,ANFIS),后者利用模糊逻辑。通过皮尔逊相关分析(Pearson Correlation Analysis,PCA)分析ML方法的输入特征,并通过穷举搜索(Exhaustive Search,ES)选择ANFIS方法的额外输入,以识别具有最低均方根误差(RMSE)的最佳输入组合。个别ML方法在不同大小的数据集上进行评估,使用与SOH高度相关的特征和所有特征集来检测过拟合。进一步实验探讨了RMSE与训练数据量的依赖关系,并使用来自另一电池的训练数据对一块电池的SOH进行估计。总体而言,实验表明几乎所有方法在SOH估计中实现了低于0.5%的RMSE,其中SVR被证明是最稳定的技术,而ANFIS在经过精心优化的配置下表现出色。

介绍

锂离子(Li-ion)电池由于复杂的物理和化学过程而经历退化,这些过程影响电池的所有组件:电极、电解质、隔离膜和电流收集器。退化是由于电池的日历老化和循环造成的,整体效果导致性能下降、内阻增加,特别是总容量减少。电池老化和退化机制可能受到关键应力因素的显著影响,例如在高电流下快速充电、将电池存放在推荐温度范围之外,或者在高放电深度(Depth-of-Discharge,DOD)下操作电池。这些因素以略微不同的方式致使电池退化。

退化机制通常分为两种主要类型:

  1. 锂库存损失(Loss of Lithium Inventory,LLI),即由于寄生反应导致锂离子损失,如金属锂在阳极表面沉积(称为锂镀膜),以及在电解质和阳极之间主要发生的固体电解质界面(Solid Electrolyte Interphase,SEI)的分解反应和生长,但在较小程度上可能还涉及阴极。
  2. 活性材料损失(Loss of Active Material,LAM)发生在电极上,可能由于颗粒开裂或失去电接触而受到损坏。

在一项研究中,锂离子电池分别经历了LLI和LAM这两种退化类型,使用一种加速老化协议,专门设计用于突出这些现象在锂离子电池中的发生。

这些降解机制主要导致电池容量和整体性能特性的下降,这最终可能导致严重问题和电池故障。这个现象由健康状态(SOH)参数表示,SOH定义为当前电池的最大容量 Q_i 与其标称容量 Q_0 之间的比率(参见公式(1)),通常以安培时(Ah)表示。

(1)

一个新的电池应该具有额定容量(标称容量),这意味着其健康状态(SOH)为100%。这个值随着时间的推移、通过充放电周期逐渐减少,并且还取决于放电深度(DOD)、工作温度和电流大小。SOH还表明电池是否适合特定的应用,因为新电池的SOH值与其寿命结束(End-of-Life,EOL)之间的周期,通常被认为是在70-80% SOH时,被称为电池的“第一寿命”周期("First life" cycle)。在这个阶段,电池主要用于需要高性能和可靠性的应用。达到EOL里程碑并不一定意味着电池将被回收;相反,它可能不再适合电动移动应用,但仍可以应用于静态电池储存系统,在这些系统中对高性能的要求不那么关键。一般来说,流经电池的电流被减少,DOD受到限制,系统在相对隔离的环境中运行,配备有许多监测元素和更先进的电池管理系统(Battery Management System,BMS),其中包括某些类型的预测性维护模型。

本研究通过对先进的机器学习(ML)技术进行严格的比较分析,为状态健康(SOH)估计领域做出了贡献,系统评估了它们在不同数据集条件下的性能。研究细致地考察了数据集大小对模型准确性和稳定性的影响,详细描述了每个模型的特性,重点关注其在不同应用中的适用性。研究调查了支持向量回归(SVR)、高斯过程回归(GPR)、前馈神经网络(FFNN)和自适应神经模糊推理系统(ANFIS),评估了它们对训练数据可用性的鲁棒性和敏感性。此外,本研究还对过拟合风险进行了全面考察,特别是在ANFIS中,并引入了一种优化的输入选择方法,以增强其泛化能力。本研究的一个关键贡献是交叉电池SOH估计分析,该分析评估了机器学习模型对来自不同电池单元的数据集的可迁移性。这些见解有助于提高电池监测系统中SOH估计的准确性,从而最终提高能源储存系统的可靠性和操作稳定性。

健康状态(SOH)估计

SOH(健康状态)估算是确保电池储能系统正常运行、可靠性和计划维护的重要组成部分。目前,已经有多种电化学、经验性或数学模型用于预测。电化学模型描述电池行为以及充电、放电和粒子运输过程中发生的复杂过程。最著名的锂离子电池电化学模型之一是Newman等人提出的伪二维(Pseudo-2-Dimensional,P2D)模型,该模型基于多孔电极行为和浓缩液体动力学的基本概念。此后,许多研究在这个模型的基础上进行了深入探讨:

  • Raj等人研究了不同充放电速率对锂离子电池退化的影响,建模了SEI(固体电解质界面)生长、锂镀层及其在不同温度下的相互作用。
  • Han等人开发了一种计算效率高的完整P2D模型求解方法,使得在快速充电过程中锂镀层的准确模拟成为可能。
  • Hashemazadeh等人通过创建单颗粒模型,对P2D模型进行了修改,特别设计用于预测在高C速率下的电池行为,并且相比完整P2D模型减少了计算需求。

电化学模型的准确性高度依赖于电池的组成和结构,因此要求这些参数被精确定义。此外,为了确保计算模型既高效又准确,基于多项研究的多种优化措施是必不可少的。

相比之下,经验模型,特别是那些完全基于数据的模型,生成的输出完全基于输入数据的质量和范围。还有一种半经验模型,其中电池被等效电路模型(Equivalent Circuit Model,ECM)所替代,双极化模型是最常用的:

  • Hentunen等人讨论了一种识别ECM模型参数的方法。
  • Wang等人通过实验参数优化和敏感性分析,增强了锂离子电池的一阶RC等效电路模型。
  • Park等人的研究中提出了一种半经验的SOH模型,以捕捉在循环和短期静息期间的电化学老化特征,从而增强退化预测。

虽然这些模型基于实验测量,但它们仍然描述了电池的性能。

尽管电化学和等效电路模型(ECM)广泛用于锂离子电池的建模,但本研究仅关注数据驱动模型,具体来说是机器学习(ML)。虽然这些方法本身可能并不提供同样水平的准确性,但通过选择适当的输入特征,其精度可以显著提高。这些模型的性能不仅依赖于所使用的数据类型,还取决于所选方法如何处理这些数据。一些方法对过拟合高度敏感,这意味着即使是轻微的噪声也会严重影响它们的性能。本研究对四种不同的机器学习方法进行了全面比较,每种方法在方法论和计算复杂性上各不相同。这种比较为特定应用中的模型选择和优化提供了宝贵的见解。目标不仅是评估估计的准确性,还要分析稳定性、对数据集大小的敏感性以及在不同电池中的兼容性。

为了应对这一挑战,本研究结合了对输入数据的精确分析和预处理,采用相关性分析和穷举搜索来优化特征选择。这项研究的结果是对根本不同的建模方法进行系统评估,定义它们在各种条件和限制下的适用性。通过审查在方法论和计算需求上截然不同的模型,这项研究提供了对其实际适用性的结构化视角,指导选择最适合电池状态健康(SOH)估计的技术。

机器学习方法

近年来,数据驱动模型,特别是使用机器学习技术的模型,在状态健康(SOH)估计方面显示出了极大的潜力。机器学习使用算法和统计模型,使得系统能够从提供的数据中学习,并在没有直接编程交互的情况下做出预测或决定。通过分析大量的实验和计算数据,机器学习算法能够发现传统方法可能忽略的隐藏模式和关联。机器学习方法可以从多个角度进行分类,主要是在训练数据的方法方面:

  • 监督学习(SL)涉及查找输入和已知输出之间的关系。
  • 无监督学习(UL)在未标记的数据上训练模型,寻找隐藏的模式和结构。
  • 强化学习(RL)基于反馈的系统工作,当模型更接近目标时给予奖励,而在模型做出相反动作时则忽略其动作。该方法依赖于试错法以获得最优结果。

概率方法包含随机性元素,并量化预测中的不确定性水平。这些方法使用贝叶斯定理根据概率分布评估结果。这些方法的例子包括高斯过程回归(GPR)和相关向量机(RelevanceVectorMachine,RVM),它们生成带置信区间的概率预测。

另一方面,确定性方法不涉及概率元素,其结果基于输入与输出之间已知的相关性,并且它们之间的关系定义明确。确定性模型假设下一个状态可以根据当前状态确定性地预测。这类方法的例子包括各种类型的人工神经网络(ANN),其关键子类别是前馈神经网络(FFNN)和自适应神经模糊推理系统(ANFIS),后者结合了模糊逻辑。深度学习(DL)是另一个主要类别,被定义为多层次的人工神经网络,著名的模型包括卷积神经网络(CNN)、循环神经网络(RNN)和长短期记忆(LSTM)网络。其他确定性方法包括支持向量机(SVM)和基于树的决策方法。

机器学习方法在众多研究中被广泛应用于估计锂离子电池的退化。在许多情况下,这些方法也被用于估计锂离子电池的充电状态(State-of-Charge,SOC):

  • 郑等人应用支持向量机(SVM)来估计健康状态(SOH),同时使用卷积神经网络(CNN)和长短时记忆网络(LSTM)模型来预测SOC,并通过NASA电池数据集验证了他们的方法。
  • Xu等人的研究中也应用了CNN-LSTM模型,用于估计SOH。

SVM 方法在电动出行应用中的在线 SOH 估计中也被广泛使用,它们有助于指示电池老化:

  • Klass 等人开发了一种基于 SVM 的方法,用于估计电动汽车锂离子电池的 SOH,利用车载数据实现了容量和电阻的准确估计。
  • Feng 等人引入了一种基于 SVM 的 SOH 估计技术,利用部分充电段,实现了锂离子电池的快速车载诊断。

人工神经网络因其对各种数据类型的适应性和计算效率而广泛应用于预测锂离子电池的状态,这使得它们也适用于实时应用:

  • 吴等人提出了一种有效的在线方法,用于估计锂离子电池的剩余使用寿命(Remaining Useful Life,RUL),结合了前馈神经网络和重要性抽样,以实现电池在运行过程中寿命的准确预测。

支持向量回归(SVR)

SVR 是为回归任务设计的 SVM 的一种适应性方法。SVR 使我们能够解决小样本量和非线性数据的问题。这种技术的功能是在高维空间中创建超平面,为高精度预测提供决策边界。为了评估SOH,元素数据被转换到一个更高维的空间,然后线性映射和回归以估计SOH值。

样本集 ,其中 x_i \in R^ny_i \in R 表示输入和输出特征向量。在这里,N 是样本的总数,n 指特征向量的维度。支持向量回归(SVR)利用一个映射函数将原始低维数据转换为由以下方程定义的更高维特征空间:(2)

其中ω是权重向量,b是偏置,φ(x)是非线性映射函数。通过引入松弛变量ζ和ζ*,确定w和b的目标可以如下数学公式化: (3)

预测值与实际值之间的偏差限制在每个数据点的误差范围内,表示为:

(4)

在这里,C是一个惩罚参数,用于调节模型复杂性与允许误差∈之间的平衡。通过引入拉格朗日乘子和使用核函数(Kernel Functions,KFs),支持向量回归(SVR)模型可以重构为:

(5)

这里,(x_i,x_j)表示核函数的矩阵,其中x_i代表用于训练的输入向量,x_j是测试样本的输入向量。拉格朗日乘数由\alpha_i\alpha_i^{*}表示。

在SVR中,可以应用几种类型的核函数,如线性、多项式、高斯或径向基函数(RadialBasisFunction,RBF)和 sigmoid 核函数。每个向量的 RBF 核函数通常定义为:

(6)

其中参数 l 是长度尺度,它决定了随距离增加,两个输入点之间的相似性下降的速度。

SVR方法可以通过与其他方法结合来进一步提高准确性。Li提出了一种新颖的方法,使用改进的蚁狮优化算法(Improved Ant Lion Optimization,IALO)结合SVR来估计锂离子电池的SOH。

高斯过程回归(GPR)

高斯过程回归是一种基于贝叶斯定理的概率性非参数技术。与支持向量回归或神经网络等其他方法不同,高斯过程回归直接捕捉模型的不确定性,并生成置信区间,指示在某种概率下预测值可能位于何处

高斯过程(GP)定义了一组可能函数的概率分布,通常表示如下:(7)

其中m(x)表示均值函数,κ(x,x')是协方差函数,也称为KF。

(8)  (9)

在这里,对于有限数量的输入点 X=x1…xn,定义了概率分布。在这种情况下,它是高斯分布 p(f(x1)…f(xn)),具有均值 m(x) 和协方差矩阵 K(x),其中 。最常用的协方差函数是平方指数 (Squared Exponential,SE),也称为 RBF。在本实验中,使用了有理二次 (Rational Quadratic,RQ) 协方差函数。参数 σ² 是输出方差,决定了预测值的范围。

(10)

其中参数α控制大型和小型变化之间的相对权重,l是长度尺度。

基于高斯过程的无参数回归方法,其中采用一种通用方法,不需要精确定义函数的形式,如线性或多项式回归。函数f(x)被视为高斯过程中的一个随机样本,这使得可以建模一组可能的函数,而无需事先定义它们的形状。

(11)

这个方程定义了对新输入 X* 的新值 y* 的预测,该结果依赖于训练数据集 (X, y)。预测的均值 m* 是根据新点与训练点之间的协方差关系计算得出的:

(12)

预测的协方差 cov(y*) 是根据新点 X* 和训练数据 X 之间的协方差关系计算的。

(13)

众多研究表明,GPR方法在电池状态预测方面具有显著的效果:

  • Reddy等人采用GPR对锂离子电池进行SOH估计,利用电压、电流和温度等间接健康指标,并展示了最高的估计准确性。
  • Wang等人开发了一种改进的GPR模型用于锂离子电池的SOH估计,达到1.7%的平均绝对误差(MAE)和2.41%的均方根误差(RMSE)。

前馈神经网络(FFNN)

人工神经网络被设计用来在数学上模拟人脑的神经活动,是用于各种应用(如模式识别、优化和预测)的最流行的算法之一。前馈神经网络由三个主要部分组成:

  • 输入层:接收数据,并直接将其转发给隐藏层
  • 隐藏层:每个隐藏层中的神经元计算一个加权线性组合,并通过激活函数,或更具体地说,通过传输函数,将信息转发到下一个隐藏层。这个过程持续进行,直到信息到达输出层,
  • 输出层:输出层预测模型的目标输出。

这些神经元之间的连接可以分别用第i个、第j个和第k个节点来表示。在输出层的前向传播过程中,进行以下计算:

(14)  (15)

其中,i表示输入层中的节点,j是隐藏层中的节点,k是输出层中的节点。在这里,y是输出,b是偏差项。w_{i,j} 是连接来自一层到另一层的节点的权重。激活函数用 g 表示,它可以是一个非线性函数,决定从加权输入的总和中得出的输出。有许多类型的激活函数,但最受欢迎的是线性、sigmoid、双曲正切和修正线性单元(RectifiedLinearUnit,ReLU)。

神经网络的反向传播阶段涉及根据梯度下降算法调整权重。以下规则指导权重更新:

(16)  (17)

在这些方程中,η代表学习率,x_{i}是输入信号,T_{i}是特定节点的目标输出,A_{i}是实际输出。权重变化\Delta w_{i,j}用于更新权重,通过这个迭代过程提高网络的性能。

自适应神经模糊推理系统(ANFIS)

ANFIS将模糊逻辑的原则与神经网络整合,以构建能够从数据中学习并进行预测的模型。模糊逻辑超越了经典布尔逻辑的严格界限,通过引入部分隶属的概念,将真值以0到1之间的连续值表示。这使得变量可以分类为具有真值的模糊集,而不仅仅是二元的全有或全无分类。在ANFIS的神经网络部分,通常构建为前馈神经网络(FFNN),输入数据通过网络层顺序处理以产生输出。ANFIS的强大之处在于其近似非线性函数的能力。它通过接受输入并应用模糊逻辑来确定各种集合的隶属度,这一过程称为模糊化。这个阶段之后是基于T-范数运算符应用模糊规则,这些运算符将AND操作概念泛化到模糊逻辑中,以将这些隶属度组合成模糊结果。这些规则源自于Takagi-Sugeno模型,指导推理过程在系统中的正向传递,利用最小二乘法优化规则参数。这一过程类似于神经网络中常用的求和和激活函数。然后,神经网络采用一种梯度下降形式,如反向传播,以微调模糊系统的参数,包括隶属函数(MembershipFunctions,MFs)的形状以及基于训练数据的模糊规则中的权重。最后一步,去模糊化,将模糊分类转换为清晰的输出,表示模型的预测。

ANFIS架构包含一组Sugeno模型的模糊if-then规则,每个规则都有自己的一组输入-输出对。一般来说,对于典型的一阶Sugeno模糊模型,定义了以下两个规则:

其中x1和x2是输入变量,A_{i}B_{i}表示与这些输入相关的模糊集。输出函数f1和f2是输入变量及其相应的规则特定参数p_{i}q_{i}r_{i}的线性组合。

ANFIS结构一般分为五个层次(见图2):

  • 模糊化层:fuzzification layer
  • 规则层:rule layer
  • 归一化层:normalization layer
  • 去模糊化层:defuzzification layer
  • 输出层:output layer
图2:一个由五层组成的ANFIS结构,包括模糊化、规则层、归一化、去模糊化和输出。

模糊化层,每个节点是自适应的。该层直接与输入变量x1和x2进行交互。在这里,节点作为模糊化器,将清晰的输入值转换为模糊集合中的隶属度。这些模糊集合的参数是可调整的,使得系统能够从数据中学习。例如,常用钟形隶属函数(bell-shaped MF),它由三个参数a_{i}b_{i}c_{i}定义。这些参数分别决定钟形曲线的宽度、斜率和中心。它输出给定模糊集合A_{i}B_{i-2}的输入变量的隶属等级。

(18)

其中\mu_{A_{i}}(x_1), \mu_{B_{i-2}}(x_2)是模糊集A_{i}B_{i-2}的隶属函数。钟形隶属函数可以通过以下方程表示:

(19)

规则层由一组固定节点组成,每个节点代表一个模糊规则。每个节点的输出是所有输入信号的乘积,这对应于将模糊运算符(在 Sugeno 模型中是 AND)应用于来自Layer 1的隶属度。该输出是规则w_{i}的激活强度,表示模糊规则的前提部分满足的程度。

(20)

归一化层中,规则的强度被标准化。该层中的节点是固定的,计算每个规则的激活强度与所有规则激活强度总和的比率。这个归一化过程确保标准化的激活强度之和等于1,为系统在后续层级中的去模糊化过程做好准备。

(21)\overline{w_i}是归一化的激活强度

去模糊化层包含自适应节点,这些节点计算每个规则对最终输出的贡献。每个节点的输出是输入变量的一个函数,并受到来自Layer 3的标准化触发强度和规则的相应参数的调制。这些参数类似于线性回归模型中的系数,并且在训练过程中进行调整,以将模糊规则映射到期望的输出。

(22)

最后一层代表输出层,它将所有规则的贡献聚合起来,产生一个单一的清晰输出。这一层的单个节点总和了第四层提供的加权输出,Layer 4是去模糊化的值。这里的权重是来自Layer 3的归一化激活强度,确保适用性更高的规则对最终输出有更显著的影响。

(23)

通过在学习中调整Layer 1和Layer 4的参数,ANFIS可以近似非线性函数。这种学习通常是通过借用神经网络训练的方法,如反向传播和最小二乘估计,来完成的,从而使系统能够优化其参数,以更好地建模输入和输出之间的复杂关系。

ANFIS是一种可适应的方法,尽管它可能对高噪声水平或弱相关性的数据敏感,这可能影响SOH估计的准确性。在某些情况下,选择优化的数据或结合噪声抑制技术可以进一步改善ANFIS的预测性能。例如,Meng等人开发了一种混合方法,将完整的集合经验模态分解与自适应噪声和ANFIS结合起来,以提高锂离子电池容量预测的准确性,通过解决再生效应。在NASAL锂离子电池数据上的验证表明,这种方法有效地减少了容量再生的负面影响,提高了预测准确性。

微调(Fine-tunning)

微调是一种迁移学习技术,能够使预训练的机器学习模型以最少的额外训练数据适应新的数据集,从而在不需要从头训练模型的情况下提高泛化能力。这个过程使用较小的特定任务数据集来优化模型的参数,以针对新的但相关的问题优化其预测。微调在数据收集成本高或有限的应用中尤其有效,因为它利用先前的知识,同时在新领域提高性能。

在这项研究中,微调被应用于增强SOH估计模型在不同电池数据集中的适应性。具体来说,针对一个锂离子电池数据集训练的模型,通过使用另一种电池数据的子集进行微调,使其能够学习特定于电池的退化特性,同时保留一般的预测能力。这种方法确保了在不同电池化学成分或操作条件之间过渡时,提高了准确性和鲁棒性。

在之前的研究中,微调在电池健康估计中的有效性得到了证明:

  • Che等人结合了迁移学习和在线模型校正,使模型能够动态适应新的退化模式,并实现高精度的剩余使用寿命(RUL)预测。
  • Che等人引入了一个自学习框架,该框架使用有限的标记数据点和自生成的伪标签微调电池寿命预测模型,减少了对大规模训练数据集的依赖。

实验

该研究针对三星INR18650–35E电池进行,该电池的标称容量为3.4Ah,使用锂镍锰钴氧化物(NMC)作为阴极材料,石墨作为阳极材料。测试在室温下进行,采用恒定电流恒定电压(Constant Current Constant Voltage,CCCV)充电方法和恒定电流(Constant Current,CC)放电,总计进行了600个循环。电池以0.5C的恒定电流充电,直到达到4.2V的电压,此后启动恒定电压阶段,直到电流下降到68mA。放电截止电压设置为2.65V。三星INR18650–35E电池的进一步规格在表1中概述。

图3显示了两种电池在环境温度下的状态健康(SOH)变化,从新电池状态到大约0.82的SOH。

在100个周期的间隔内对电池进行了额外的测试,期间电池被暂时移除操作。这个过程导致电池在整个循环过程中容量增加。

表一:三星INR18650–35E电池的参数。
图3:SOHo的两个三星INR18650–35E电池,标记为电池1(B1)和电池2(B2)。

特征提取

在这项研究中,特征是从测量值中手动提取的,这需要领域知识和额外的分析。然而,这种方法可以降低预测误差。还有一些研究中,特征是自动提取的;例如,Jiang等人提出了一种自动化方法,使用卷积自编码器进行特征提取,并采用自注意力机制来提高预测准确性。

选择了七个特征用于状态健康(SOH)估计,这些特征是从测量数据中提取并分析其相关性的。虽然实验主要集中在充电周期的特征上,但也纳入了放电周期的参数以提高估计的准确性。这种组合使得分析更为全面,因为放电特性为电池的整体行为提供了宝贵的见解。

尽管该研究基于受控实验室测量,但它反映了现实世界的场景,在这些场景中,电池经常随机放电,而充电过程在达到一定放电电压后通过CCCV方法保持一致。通过使用充电和放电周期的参数,实验提供了一种更全面的SOH估算方法,增强了其实际适用性。

用于状态健康预测的容量下降的第一个指标是电压在恒流(CC)阶段达到特定里程碑的时间。从图4(a)可以明显看出,随着循环次数的增加,达到4.2 V的时间减少,特别是在充电转换为恒压(CV)阶段的点。在这种情况下,电压范围为3.2 V到4.15 V,表示为t_{V(ch)}

图4:从充电电压曲线中提取时间依赖特征 tv (ch) (b)
图5:从放电电压曲线(a)提取了时间依赖特征tv(d)(b)
图6:从当前下降CV过程(a)中提取的时间依赖特征 tI(ch)(b)

Shu等人分析了该参数的相关性,取决于所选电压范围,发现对于3.4 V到4.1 V的范围,所研究样本的相关性接近1。图4(b)显示了整个范围内B1的SOH的强相似性,这可能归因于选择了较宽的充电电压范围。基于视觉分析,该参数表明t_{V(ch)}可以被定义为SOH估算的良好特征。下一个特征来源于放电循环,其中监测从开始放电到电压降到3.6 V的时间,并将其标记为t_{V(d)}(见图5(a))。尽管该输入受噪声影响,但从大约50个循环开始,它表现出强相关性或相似性(见图5(b))。在这种情况下,可以在与其他参数相比显著更短的时间内以高准确度估算SOH。

第三个预测输入是从充电阶段的当前曲线提取的。显著的变化主要发生在恒压阶段,在这里排放曲线随着电池循环次数的增加而变化。在图6(a)中,显示了第1次和每100次循环(最多500次循环)时的单个电流下降曲线,很明显电流下降得更早。选择0.5 A的阈值是基于电池不会达到满电的假设。从开始充电到电流达到0.5 A之间的时间间隔定义为t_{l(ch)},并且它对周期数的依赖在图6(b)中进行了说明。

电池在环境温度下测量;然而,即使是环境温度在这种情况下也显示出显著的波动。图7中显示的电池单元的平均温度T_{avg},作为循环次数的函数,也被用作SOH估计的指标,因为温度在电池的退化机制中可以起到关键作用。

预测器 t_{Tpeak(ch)}  表示在充电周期中达到最高温度的时间(见图 8(a))。这个峰值发生在从 CC 阶段过渡到 CV 阶段时。尽管这一特征在本研究中被强调为具有很高的相关性,但在这里并非如此。环境温度在测量过程中受到显著的波动和变化的影响,这降低了该输入的质量。如图 8(b) 所示,虽然该输入保持了一定的 SOH 趋势,但也包含了大量的噪声,这可能对结果产生负面影响。

图8:充电周期达到温度峰值的时间 tTpeak (ch)

电池采用CCCV方法充电,根据之前的研究,随着电池循环次数的增加,充电时间也缩短,特别是在CC阶段,此时电池以0.5C或1.7A的电流充电。因此,电池在充电过程中更快地达到4.2V,从而导致充电周期中的平均电压逐渐增加(见图9)。这一特性被称为V_{avg(ch)},表示在充电周期中测得的平均电压,包括CC阶段和稳态阶段。显然,V_{avg(ch)}与SOH之间有强烈的负相关关系。在放电周期中,电池达到截止电压2.65V所需的时间减少。平均放电电压V_{avg(d)}也随着循环次数的增加略微下降(见图10),为电池衰老提供了额外的见解。

图7:电池单元的
平均操作温度 Tavg
图9:电池单元的
平均充电电压Tavg(ch)
图10:图9:电池单元的
平均放电电压Tavg(d)

特征选择

尽管所有参数在视觉上表明与电池的健康状态(SOH)存在某种相关性,但它们还进行了相互相关性分析,以确定它们与SOH的相关性强度以及它们之间的相互关联。具体而言,本实验使用了皮尔逊相关分析。相关系数的值用\rho _{X,Y}表示。

(24)

这里X和Y代表两个随机变量,其中cov(X,Y)表示它们的协方差,σX和σY是标准差,N是数据集的长度。在图11和图12中,个别输入与SOH之间的相互关系被描绘出来,突出显示t_{V(ch)}t_{V(d)}t_{l(ch)}V_{avg(ch)}V_{avg(d)}将在SOH估计中显著贡献。温度的相关性较弱,但仍然可以为预测电池衰退提供有价值的见解。相比之下,峰值温度t_{Tpeak(ch)}与SOH之间的相关性较弱,数据中的显著噪声可能降低预测的准确性。

均方根误差(RMSE)

每种方法的总体误差比较是通过均方根误差(RMSE)进行的,该RMSE是通过实际值与通过机器学习(ML)获得的估计值之间的平均平方差的平方根计算得出的。从数学上讲,RMSE表达为:

(25)其中 n 为循环次数,y_{i}表示测量数据,\widehat{y_{i}}为估计的 SOH 值

穷举搜索(ES)

由于ANFIS方法对过拟合高度敏感,仅依靠相关性矩阵来确定适当的输入以进行SOH估计是不够的。因此,需要进行更全面的分析,利用穷举搜索(ES)方法。该方法通过计算训练和测试数据集的估计输出的RMSE来评估输入组合,使用单个周期进行评估。通常,应用简单的配置,例如最少的周期数和MFs,以便进行快速高效的分析。尽管如此,某些输入组合的RMSE值仍会随着周期数的增加而有所变化。为了解决这个问题,构建了一个矩阵来分析不同周期数量(范围从1到30)和2到4个输入的不同组合下的RMSE,使用290个周期的训练数据集,这对应于完整数据集的一半。

需要注意的是,选择误差最低的组合并不总是最优的,因为某些组合在290个周期时表现出较低的误差,但在较小或较大的数据集上则出现了显著更高的误差。

  • 对于B1,分析了各种输入组合,选择了三种输入的组合:t_{V(ch)}t_{V(d)}t_{l(ch)},因为它在使用一半的测试数据集和10个周期时显示出最低的测试RMSE。另一方面,三种输入的组合可能会表现出显著高于其他类型组合的RMSE,即使这些组合涉及的输入具有非常强的相关性。
  • 对于B2,选择了在11个epochs下的两个输入t_{l(ch)}V_{avg(ch)}的组合。这个组合在测试RMSE上表现较高,但在训练数据集长度改变时波动性较低。这一特征只能根据结果的反馈来识别。

由于ANFIS是一种对过拟合高度敏感的方法,因此也有必要观察其在不同训练数据集长度下的表现。在较大的数据集中,新信息可能会显著影响使用ANFIS时的状态健康(SOH)估计行为,因此,使用一半的训练数据有时可能会导致比使用三分之一的训练数据更高的均方根误差(RMSE)。

结果与讨论

这项研究在使用CCCV方法的锂离子电池上进行了600个循环的实验,尽管由于测量不准确,实际使用了580个循环。采用了四种机器学习方法进行估计分析:SVR、GPR、FFNN和ANFIS。每种方法使用不同数量的数据进行分析,显示出略微不同的估计误差。这些技术还需经过各种额外测试,包括过拟合分析、跟踪在每个循环中从190到400循环的每种方法的均方根误差(RMSE),以及基于B1的训练数据对B2的SOH估计的最终测试。

在这项研究中,比较了四种数据驱动的方法,这些方法通常被称为机器学习技术,每种方法都提供了一种独特的方式来估计三星INR18650–35E锂离子电池的状态健康(SOH),这些电池在实验室控制条件下使用CCCV方法进行了循环。为了进一步扩展分析并评估模型的泛化能力,还纳入了另一组棱柱形锂离子电池的数据,从而允许在不同电池上进行交叉验证。

  • 在确定性方法中,支持向量回归(SVR)在各种数据集长度中表现出稳定的性能,特别是在过拟合测试中。除了t_{Tpeak(ch)}以外,所有特征都被使用,因为t_{Tpeak(ch)}表现出显著的噪声,导致均方根误差(RMSE)为0.19%。此外,在基于B1数据的B2预测中,SVR表现最佳,尽管所有方法由于SOH估计后半段的向量偏差产生了几乎相同的结果。
  • 在人工神经网络(ANN)类别中,前馈神经网络(FFNN)在使用B1数据预测B2的SOH时表现尤为出色,特别是在利用B2的50个周期进行微调时。该技术的RMSE为0.39%,成功预测了第二块电池余下的530个周期。
  • 自适应神经模糊推理系统(ANFIS)方法同样属于ANN类别,由于其固有的变异性,需要根据ES进行输入选择。当使用2/3的数据集进行训练时,该方法表现最佳,尽管在过拟合测试中表现较弱。ANFIS在训练周期数量变化时,RMSE显示出显著的变异性,对于较小的数据集,RMSE在0.50%以下时表现良好。然而,在数据集的一半到三分之一之间,RMSE快速增加了30倍,突显了该方法对在其他上下文中表现更好的某些输入组合的敏感性。
  • 相比之下,代表概率技术的高斯过程回归(GPR)方法,尽管在本质上是不同的方法,但在RMSE趋势上与ANFIS相似。GPR中的RMSE随着训练数据集的大小快速增加,但与ANFIS不同的是,它在过拟合上保持显著的稳定性和抵抗力。

每种方法都有其独特的优点和挑战:

  • ANFIS表现出高准确性,但由于其变动性,需要仔细选择输入。
  • FFNN在特定情况下显示出稳定的RMSE,并且在揭示隐藏模式方面表现有效,例如在对第二块电池进行SOH估计时进行了微调。
  • SVR是最稳定的方法,能够在所有SOH预测任务中提供可靠的结果,包括过拟合的挑战。实现SOH估计准确度低于0.50%的总体目标几乎在所有情况下都得到了满足,唯一的例外是基于B1数据对第二块电池的SOH估计。即使这个目标也可以通过简单的机器学习方法如SVR来实现。每种方法在SOH估计中都有其适用之处,具体取决于准确性、稳定性和数据集条件的具体要求。
  • ANOFS等独特方法在SOH预测中很少被应用。实验结果表明,只要输入特征选择得当,ANFIS可以达到出色的性能。

实验还揭示了个别方法的局限性,突出显示了其他方法可能表现突出的领域。本研究表明,仔细选择方法和有效的特征工程可以在SOH预测中实现高准确性,为实际的现实世界应用铺平道路。

参考文献:

Advanced machine learning techniques for State-of-Health estimation in lithium-ion batteries: A comparative study

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值