基于驾驶模式预测器的双源电动汽车实时能量管理
摘要
为了最小化电动汽车(EV)的电池老化,高效管理其能耗至关重要。最近开发了一种能量管理策略(EMS),该策略根据驾驶员手动确定的驾驶模式来协调电池和超级电容器的工作。在本文中,我们通过开发一种驾驶模式预测器(DMP)来改进该EMS,该预测器能够仅根据车辆的速度历史,在实时条件下自动确定驾驶模式。DMP采用机器学习(ML)的一个分支——监督学习进行设计。我们方法的一个优势在于其适用于预测任意电动汽车的驾驶模式。为了预测特定电动汽车在行程中的驾驶模式,DMP需要跟踪该车辆的速度变化并知晓其可达最高速度。将DMP集成到EMS中后,形成了一种称为基于DMP的能量管理系统(DMP‐based EMS)的增强型能量管理系统,该系统可根据车辆的速度历史,在实时条件下自动确定从电动汽车各能源获取的功率。基于实际驾驶循环所获得的结果证实了DMP的预测质量以及所提出的基于DMP的能量管理系统(DMP‐based EMS)的能效。
索引术语 — 电动汽车(EV),双源电动汽车,电动汽车能耗(ECEV),能量管理策略(EMS),驾驶模式预测器(DMP),机器学习(ML),监督学习(SL)。
一、引言
延长电池寿命对于电动汽车(EV)至关重要,因为电池是电动汽车中成本最高的部件。通过添加超级电容器(SCs)——一种高功率密度储能装置,以吸收牵引功率需求的高动态变化,从而降低电池老化应力,是一种有前景的方法。电池与超级电容器的结合构成混合储能系统(HESS),该系统可配置为主动式或半主动式[1]–[3]。当使用多个能量源时,能量管理策略(EMS)对于协调这些能源的功率流和能量水平至关重要[4]–[6]。在由电池/超级电容器混合储能系统供电的电动汽车中,能量管理系统(EMS)分配电池和超级电容器的功率,以平滑并降低电池老化因素[7]–[9]。为了分离能源的频率,可以采用小波变换技术。在[10]中,小波变换与非线性自回归神经网络结合用于电池/超级电容器军用混合动力车辆。该神经网络预测需求功率,以便小波变换对功率频率进行分解。燃料电池/电池/超级电容器混合储能系统被视为一个多输入多输出(MIMO)系统,并由控制Lyapunov函数(CLF)进行控制[11]。
人工神经网络(ANN)是一种可用于能量管理系统(EMS)开发的智能方法。在[12]中,使用一个简单的双层网络来计算电池/超级电容器系统中超级电容器的电流参考值,并将结果与基于庞特里亚金极小值原理(PMP)的最优EMS进行比较。人工神经网络的一个强大能力是模式识别,因此常用于识别和/或预测。另一种方法是在[13]中提出,利用动态规划(DP)推导最优解,用于训练人工神经网络以实现实时应用。所研究的系统是由电池/超级电容器混合储能系统供电的并联式混合动力电动汽车。该优化问题的目标是最小化燃油和电能消耗的总成本,并对混合储能系统的最终能量状态施加惩罚。一种基于长度比的人工神经网络被实现,据说可减少微控制器上实时实现所需的计算量。
迄今为止,已有若干研究探讨了基于规则的策略([14],[15])的能量管理系统(EMS)分配,以最小化电动汽车(EV)的能耗(ECEV)。然而,在现有文献中,将机器学习(ML)作为一种先进解决方案用于最小化电池退化和能耗的研究还较少[16]。近年来,机器学习在该领域受到了越来越多的关注。例如,[17]的作者专注于开发一种机器学习模型,以减少多电源车辆系统中的功率损耗。该研究进行了两项测试:在第一项测试中,机器学习算法学习在多电源和负载系统中最小化功率损耗的相关知识;在第二项测试中,算法基于第一项机器学习算法生成的知识进行训练,以便根据给定的负载需求和驾驶过程中任意时刻的车辆功率状态,选择合适的电源组合。结果表明,基于机器学习的模型能够有效降低功率损耗。因此,使用能够高效处理此类问题的机器学习技术来最小化能耗是非常合适的。
[18]的作者开发了一种策略,用于实时决定从每个能源获取多少功率,其决策准则是最小化电池老化和能耗。该最小化问题被表述为一个最优控制问题,其最优解是一种关系,该关系根据驾驶模式确定从每个能源获取的功率。以下是四种典型的驾驶模式:城市、市郊、乡村和高速公路[19]。该方法的原理是,一旦计算出电动汽车的瞬时驾驶模式,便能从该驾驶模式实时推导出协态变量λ的值,然后将从各能源获取的功率指定为电池的参考电流ibat ref,该参考电流由λ计算得出。[18]中能量管理系统的局限性在于,驾驶模式由驾驶员手动确定,驾驶员必须通知能量管理系统每一次驾驶模式的切换。
在本研究中,我们通过增加一个驾驶模式预测器(DMP)来改进[18]的能量管理系统(EMS),该预测器可根据当前行程中的电动汽车速度历史,实时自动确定电动汽车的驾驶模式。DMP采用机器学习(ML)的一个分支——监督学习(SL)进行设计。将DMP集成到[18]的EMS中,形成一种称为基于DMP的能量管理系统(DMP‐based EMS)的增强型能量管理系统,该系统可根据电动汽车的速度历史,实时自动确定从各能源获取的功率。此外,我们现在使用四种驾驶模式,而非[18]中提出的三种模式。我们方法的一个优势在于:仅需针对单辆电动汽车的行驶特性开发一个通用的DMP,然后通过配置电动汽车的可达最高速度对其进行参数化,即可将其应用于任意电动汽车的驾驶模式预测。所提出的工作具有四项主要贡献,具体介绍如下:
-
DMP设计通过改进数据集以及生成和比较多种机器学习预测模型 :我们对所使用的数据集(即标准驾驶循环全球统一轻型车辆测试循环(WLTC))进行了改进,以通过多个步骤设计我们的驾驶模式预测器。我们通过实验确定了应作为输入记录在数据集中的相关特征(见III-C、III-D和III-E-1节),并使用朴素贝叶斯算法改进了WLTC数据集的输出(即驾驶模式),因为我们发现将WLTC及其原始模式用作机器学习的训练数据集时,在新测试中的驾驶模式预测准确率不理想。该改进的数据集有助于更精确地训练和测试所提出的模型。我们在第三节III-E-1中应用了11种机器学习算法,开发了11个预测模型,对应11个版本的驾驶模式预测器(DMP),每个版本均采用10折交叉验证技术进行开发。这11个模型包括7个超参数使用默认值的模型,以及4个通过网格搜索优化方法选择超参数值的模型。我们在第三节III-E-2中基于五种准确度指标(准确率、精确率、召回率、F值和对数损失)并使用为每个候选模型赋分的博尔达计数投票系统,对11个模型的预测结果进行了比较。得分最高的模型为获胜(即被选中)模型。
-
在多个数据集中验证设计的驾驶模式预测器 :我们将所选的驾驶模式预测器应用于多个数据集,这些数据集涵盖了不同驾驶条件的真实和人工行程。本文展示了针对三个数据集新欧洲驾驶循环(NEDC)、联邦测试程序(FTP)和额外城市驾驶循环(ECE)(图6、7和8)所获得的结果,这些数据集记录了标准驾驶循环的速度变化。
-
增强型能量管理系统的设计 :将我们的驾驶模式预测器集成到[18]的能量管理系统中,形成了基于DMP的能量管理系统,带来了多项优势:如第三节III-A所述,我们的驾驶模式预测器实现了原本需要驾驶员在[18]的能量管理系统中手动完成的任务。因此,我们的驾驶模式预测器提高了驾驶舒适性,并降低了出错风险。此外,马尔可夫决策过程(MDP)每秒重复一次其驾驶模式预测任务,这是驾驶员无法实现的。在第三节III-B中:我们采用了速度和加速度的缩放方法,使得我们的驾驶模式预测器适用于任何电动汽车,即使它是基于特定类型车辆的数据集设计的。同时请注意,我们的系统适用于多种道路类型,如城市、市郊、乡村和高速公路。在第四节中:基于DMP的能量管理系统得到了评估(图11),并与其它系统(图10)进行了比较,包括电池电动汽车、手动能量管理系统以及动态规划(DP)(基准)。
-
首项针对纯电动汽车最小化能耗的基于机器学习的研究 :据我们所知,这是首个通过开发驾驶模式预测器(DMP)来解决分类问题,以最小化电动汽车能耗(ECEV)的基于机器学习的研究。我们的DMP与其他系统不同之处在于其参数的配置方式(见第三节III-E-1)。
本文的结构安排如下:第二节概述了在[18]中开发的EMS。第三节介绍了我们设计的DMP及其获得的结果。第四节展示了DMP与EMS的集成,从而实现了增强型能量管理系统。第五节总结全文并提出一些未来工作。
II-电动汽车电池/超级电容器能量管理策略
A. 混合储能系统
HESS是两种或多个电气储能系统和/或能源源的组合,以结合高功率密度和高能量密度设备的优势。电池与超级电容器之间的混合是电动汽车混合储能系统(HESS)中有前景的解决方案之一[20]。目前,电池是电动或混合动力车辆中最昂贵的部件。在驾驶循环中电池的老化退化因此成本较高。因此,增加超级电容器以减少对电池的老化应力具有重要意义。
超级电容器主要通过三种方式组合:被动式、半主动式和主动式拓扑结构。
被动式结构(图1.a)是电池/超级电容器混合储能系统最简单的拓扑结构。电池和超级电容器直接在直流母线上并联,并为牵引子系统供电。由于超级电容器的内阻远低于电池,且其动态响应速度远快于电池,因此超级电容器能够补偿牵引部分所需的大幅波动电流。该方案对于混合储能系统而言成本相对较低,结构简单、高度可靠,且无需控制和能源管理。然而,电流补偿是被动的,而非可控的,因此无法实现能量管理系统(EMS)。此外,超级电容电压被固定在电池电压上,导致与电压直接相关的超级电容器能量只能利用很少一部分。因此,这种拓扑结构通常用于对简单性和高可靠性有要求的应用场景,例如[21],[22]。
为了有效利用超级电容器(SCs)支持电池,应增加一个双向DC/DC变换器来控制超级电容器的功率,从而形成半主动式结构(图1.b)。超级电容器与一个电感器串联,之后连接到电力电子斩波器的低压侧,以实现双向DC/DC变换器功能。斩波器的高压侧与电池并联。直流母线电压由电池电压固定。该拓扑结构仅需增加一个DC/DC变换器即可实现对超级电容器功率的控制,从而获得电池的最优功率特性。该方案在性能与成本和/或复杂性之间实现了良好折衷,因此广泛应用于许多领域,例如[10],[23]。半主动式结构的缺点是电池电压必须足够高以供给牵引子系统。重型车辆(如卡车或公交车)需要较高的直流母线电压,这对电池尺寸设计可能带来挑战。此外,直流母线电压的失控可能导致牵引子系统中电动机(EM)驱动的非最优运行。
为了克服上述半主动拓扑的缺点,主动式结构常受到关注(图1.c)。在电池端增加一个DC/DC变换器,并与超级电容器支路的斩波器并联连接。它们通过直流母线电容向牵引子系统供电。因此必须对直流母线电压进行控制。采用这种结构,电池电压低于直流母线电压,从而在高压应用中使电池尺寸设计的挑战性降低。直流母线电压可被控制为恒定,或根据电机驱动子系统的最优运行情况进行调节。由于其高性能,主动式拓扑在许多应用中广受欢迎,例如[24],[25]。其缺点在于控制方案更为复杂,涉及更多的电压和电流控制和附加设备的成本。
B. 面向策略的模型
在所研究的系统中,采用半主动式结构的超级电容器子系统,以兼顾成本和有效性来降低电池老化应力。在此拓扑结构中,电池与超级电容器通过一个包含电感器和电力电子斩波器的双向直流‐直流变换器连接至直流母线,如图2所示。直流‐直流变换器的输出斩波器电流ich由位于本地层的电流控制器进行控制。斩波器电流参考值ich ref由测得的牵引电流 itrac以及由能量管理系统(EMS)生成的电池电流参考值ibat ref推导得出。该策略位于上层,向上层控制层施加参考值。因此,电流控制环的响应必须快于能量管理问题的动态过程。这样,在设计能量管理系统时,可假设变换器电流能够立即跟随其参考值。因此,直流‐直流变换器及其电流控制器的面向策略的模型可表示为:
$$
ich= ich ref; ichubat= iSCuSCη k \quad \text{with} \quad k=\begin{cases}
1 & \text{if } iSCuSC \geq 0 \
-1 & \text{if } iSCuSC < 0
\end{cases}; \quad (1)
$$
其中η是变换器效率,k是关于超级电容器功率流向的系数。
超级电容器被视为一个具有极大电容 $C_{SC}$ 的理想电容与一个内阻$r_{SC}$的组合,该内阻导致开路电压$u_{SC}^{OC}$与输出端电压$u_{SC}$之间的压降。
$$
u_{SC}= u_{SC}(0) - \frac{1}{C_{SC}}\int_0^t i_{SC}dt - r_{SC}i_{SC}. \quad (2)
$$
由于电池荷电状态与其开路电压之间存在如下非线性关系,电池模型变得更加复杂:
$$
u_{bat}= u_{bat}^{OC}\left(\text{SoC}
{bat}(0) - \frac{1}{3600C
{bat}}\int_0^t i_{bat}dt\right)-r_{bat}i_{bat}; \quad (3)
$$
其中电池容量以安时为单位,$u_{bat}^{OC}$的非线性函数由查找表给出。
由于本研究聚焦于混合储能系统,牵引子系统可被视为一个电流源,向储能装置施加牵引电流$itrac$:
$$
itrac= \frac{P_{trac}}{u_{bat}} \quad (4)
$$
其中$P_{trac}$是牵引子系统动力学对驾驶循环响应所产生的功率曲线。详细的牵引部分建模发表在[18]中。
由(1)-(4)式,考虑超级电容器内阻较小和高变换器效率,可得到混合储能系统的策略导向模型:
$$
\frac{d}{dt} u_{SC}= \frac{u_{bat}}{u_{SC}C_{SC}}(i_{bat}^{ref} - i_{trac}) \quad (5)
$$
哪一个可以表示如下:
$$
\frac{d}{dt} u_{SC}= \underbrace{\frac{1}{u_{SC}}}
{\text{State variable}} \underbrace{\frac{1}{C
{SC}}}
{\text{Parameter}} (\underbrace{i
{bat}^{ref}}
{\text{Control variable}} - \underbrace{i
{trac}}
{\text{Disturbance}}) \underbrace{u
{bat}}_{\text{Disturbance}}. \quad (6)
$$
以下是几点说明:该面向策略的模型是非线性的,但比完整动态模型更简单;只有一个由系统数据表提供的参数$C_{SC}$;仅有两个可测量的干扰$u_{bat}$和$i_{trac}$。
C. 哈密顿最小化实时能量管理系统
能量管理系统的目标是最小化目标函数。
$$
J= \int_{t_0}^{t_f} i_{bat}^2 dt \quad (7)
$$
这意味着延长电池寿命。如[18]所述,应用庞特里亚金极小值原理(PMP)的第三个必要条件来推导电池电流参考值$i_{bat}^{ref}$的解析控制律。为此,系统的哈密顿函数表示为:
$$
H= i_{bat}^2 + \lambda \frac{1}{u_{SC}C_{SC}}(i_{bat}^{ref} -i_{trac}) u_{bat} \quad (8)
$$
当$ich^{ref}$由补偿$i_{trac}$的$i_{bat}^{ref}$给出时,可适于获得控制律$ich^{ref}$,然后推导出$i_{bat}^{ref}$。因此,哈密顿最小化可以通过以下方式实现:
$$
\frac{dH}{dich^{ref}}= 0. \quad (9)
$$
经过[18]中介绍的一些计算,得出了电池电流参考值的控制律:
$$
i_{bat}^{ref}= \frac{\lambda u_{bat}}{2C_{SC}u_{SC}} - \frac{u_{SC}\sqrt{u_{SC}^2 -4r_{SC}u_{SC}i_{SC}}}{\sqrt{u_{SC}^2 -4r_{SC}u_{SC}i_{SC}} - u_{SC} u_{SC}^2} \quad (10)
$$
其中协态变量$\lambda$由超级电容器电容和牵引均方根电流$i_{trac}^{rms}$确定:
$$
\lambda= C_{SC}i_{trac}^{rms}. \quad (11)
$$
牵引均方根电流$i_{trac}^{rms}$是根据标准驾驶循环WLTC预先计算得出的。该循环由四部分组成,分别对应四种驾驶模式:低(L)、中(M)、高(H)和超高(EH),依次模拟城市、市郊、乡村和高速公路工况[19]。图3展示了2类车辆在WLTC下的速度曲线,其最大速度为$V_{EV}^{max} = 120$公里/小时,分别对应四种驾驶模式。速度和驾驶模式随时间的变化分别用蓝色和红色表示。EH模式绘制在$V_{EV}^{max}$的水平上,而其他模式H、M和L则分别绘制在EH水平的75%、50%和25%处。需要注意的是,这些百分比层级仅用于可视化,并不代表车辆最大速度的百分比。通过这四个特定的百分比层级,我们使得速度曲线和模式曲线(分别为图3至图8中的蓝色和红色)在视觉上呈现出相互协调的效果。
因此,能量管理控制律可以表示为驾驶模式的函数:
$$
i_{bat}^{ref}= f(\text{driving mode}). \quad (12)
$$
在我们之前的研究[18]中,研究重点是推导电池参考电流$i_{bat}^{ref}$的解析控制律,以作为实时策略。驾驶模式被假定由驾驶员通过经验手动确定。可以合理地认为驾驶员知道车辆所处的驾驶模式类型。然而,在自动驾驶汽车日益普及的时代,这种需要驾驶员额外进行的手动操作可能并不受欢迎。对驾驶模式进行智能自动识别可能具有重要意义,并可提升EMS性能。此类基于人工智能的驾驶模式预测方法的开发将在第三节中介绍。
D. 性能评估的最优基准
为了评估实时能量管理系统,应采用一种离线最优基准,其中假设驾驶循环是先验已知的。它是通过以下公式表述的最优控制问题的解:
$$
i_{bat}^* = \arg \min \int_{t_0}^{t_f} i_{bat}^2 dt
$$
$$
\text{s.t.: } \frac{d}{dt} u_{SC} - \frac{u_{bat}}{u_{SC}C_{SC}}(i_{bat}^{ref} - i_{trac})= 0
$$
$$
i_{bat}^{max} - i_{bat} \geq 0
$$
$$
i_{bat} - i_{bat}^{min} \geq 0
$$
$$
u_{SC}^{max} - u_{SC} \geq 0
$$
$$
u_{SC} - u_{SC}^{min} \geq 0
$$
$$
u_{SC}(T) - u_{SC}(0)= 0 \quad (13)
$$
其中,$i_{bat}^{max}$、$i_{bat}^{min}$、$u_{SC}^{max}$和$u_{SC}^{min}$分别是最优控制问题中控制变量和状态变量的最大和最小路径约束。最后一个方程是终端状态约束,用于确保在驾驶循环结束时超级电容器电压的电荷维持。与[18]类似,采用动态规划求解该最优控制问题,以获得离线基准,因其可提供全局最优解。
值得注意的是,所有实时能量管理系统都是次优的,因为驾驶循环事先未知。因此,对于实时能量管理系统,只能严格遵守超级电容器电压限制,而电池电流边界和$u_{SC}(T)$的终端状态约束应被视为软约束。这是因为如果超级电容电压达到其边界,超级电容器将无法再施加或吸收功率来支持电池,此时电池必须提供所有所需的牵引电流。另一方面,由于驾驶循环的结束时间未知,电量维持状态只能近似保证,而无法严格确保。
III-基于监督学习的驾驶模式预测
A. 问题定义
[18]的能量管理系统(EMS)旨在实时决定从每个能源获取的瞬时功率,以最小化电池老化和能耗。各能源提供的功率取决于当前的驾驶模式,而驾驶模式由驾驶员手动确定。因此,驾驶员必须向能量管理系统报告每一次驾驶模式切换,但这容易导致错误。
在本节中,我们提出通过自动化其手动部分来改进能量管理系统,从而减轻驾驶员指定驾驶模式切换的任务负担,降低出错风险。为此,我们开发了一种驾驶模式预测器(DMP),该预测器能够根据电动汽车速度随时间的历史变化,实时且尽可能精确地自动确定其驾驶模式。正如我们将在第四节中展示的那样,将DMP集成到[18]的能量管理系统中,自然形成了一个增强型能量管理系统。
行驶中的电动汽车的瞬时驾驶模式与电动车电机可提供的最大功率以及在行程当前阶段应用于电动汽车的速度曲线相关。在我们的研究中,考虑了四种驾驶模式WLTC:低(L)、中(M)、高(H)和超高(EH),这些内容已在第二节-C中介绍,并在图3中进行了说明。我们考虑了WLTC及其四种模式,因为目前它被公认为所有新型车辆的能耗测量方法。
我们的目标是设计一种适用于预测任何电动汽车驾驶模式的单一驾驶模式预测器(DMP),并考虑电动汽车的可达最高速度。每秒钟,电动汽车的当前速度被传输给DMP。同时,DMP每秒根据其速度的历史信息估计当前的驾驶模式。该驾驶模式在不到一秒的时间内计算完成(通常为0.2到0.6秒),然后被视为有效,直至一秒钟后进行下一次驾驶模式估计。图4示例说明了DMP的工作过程。输入(蓝色)表示从实际行程数据采集中获得的一个驾驶循环(即速度随时间变化的曲线)。实际上,DMP的输入是以1赫兹频率对该曲线进行采样得到的,因为DMP每秒读取一次电动汽车的速度。输出(红色)表示连续的模式,以阶跃函数形式呈现,因为每个估计出的驾驶模式都被视为有效,直到一秒钟后进行下一次驾驶模式估计。
乍一看,似乎可以通过识别4个相邻速度区间IL、IM、IH和IEH,并预测当电动汽车的瞬时速度属于IX时其处于模式X(其中X为= L、M、H或EH)来轻松确定驾驶模式。然而,该方案并不理想,因为从图3和图4中可以看出,速度波动强烈且持续,而驾驶模式应保持相对稳定。另一种解决方案可能是根据平均速度而非电动汽车的瞬时速度来确定驾驶模式。但是,在这种情况下,实时驾驶模式预测需要在终止于当前时刻的极短时间间隔内对速度进行平均。这一要求使得该方案与之前已被证明不理想的方案非常接近。如下一小节所述,我们提出的驾驶模式预测方案不仅基于平均速度和瞬时速度,还包括其他与速度和加速度相关的特征。
B. 使用监督学习进行驾驶模式预测
驾驶模式预测是指从有限的可能模式中估计当前的驾驶模式。这种有限性意味着这是一个可以通过监督学习(SL)解决的分类问题,而监督学习(SL)是机器学习(ML)的一个分支[26]。SL的基本思想是:基于历史经验中的输入及其对应的输出进行学习,从而能够在新的情境中根据输入预测出结果(输出)[26]。在本研究中,历史经验由速度和驾驶模式变量m随时间的变化过程确定。
电动汽车在完整行程或部分行程中的驾驶模式。这些速度和驾驶模式的变化被记录在一个数据集中,该数据集由一系列行(或实例)组成,每行的形式为{时间、速度、模式}。“时间、速度”特征是输入,“模式”特征是输出。特征“时间”从0开始,每一行递增1,即数据集每秒记录一次速度和模式。由于历史经验将用于设计新场景下的驾驶模式预测器,因此最好(并假设)该历史经验是完整的,即电动汽车在该历史经验中达到了其可达最高速度。图3所示的WLTC循环即为一个历史经验示例,该循环是在最大可达速度为120公里/小时的电动汽车上实现的。
现在考虑一次新的驾驶体验,即电动汽车(EV)的一次新行程。从行程开始时起,驾驶模式预测器(DMP)每秒接收一次瞬时速度值,并必须实时确定该电动汽车的驾驶模式。所谓实时,是指必须在接收到下一个速度采样请求之前完成驾驶模式的判断,即耗时少于1秒。此类驾驶模式预测器(DMP)通过监督学习(SL)利用历史经验进行设计,用于在新行程中预测驾驶模式。本方法的一个优势在于,尽管DMP是基于单辆电动汽车的历史经验设计而成,但该DMP仍可适用于多种不同电动汽车的新行程中的驾驶模式预测。
为了预测任意电动汽车行程中的驾驶模式,DMP需要知道该电动汽车的可达最高速度,并采用速度缩放方法,如下所述。
设EVtrain为历史经验驾驶循环中使用的电动汽车(例如图3的WLTC),$V_{train}^{max}$为EVtrain的可达最高速度。由于假设历史经验驾驶循环是完整的,即电动汽车在该历史经验中达到了其可达最高速度,因此$V_{train}^{max}$也是历史经验驾驶循环中的最高速度。我们使用索引“train”是因为记录历史经验的数据集被用作DMP设计的训练数据集。设$V_{EV}^{max}$为待预测驾驶模式的某辆电动汽车的可达最高速度,该值由系统设计者作为输入提供给DMP。在运行过程中,DMP每秒接收电动汽车的瞬时速度$v(t)$,并计算缩放后的速度$v_s(t) = v(t) \cdot \frac{V_{train}^{max}}{V_{EV}^{max}}$。随后,基于$v_s(t)$的变化来预测驾驶模式,而非基于$v(t)$。这在概念上等同于让EVtrain(而非新电动汽车)以$v_s(t)$给出的速度曲线(而非= $v(t)$)运行。
采用速度缩放的优点在于,无论电动汽车的可达最高速度如何,DMP均可适用于任何电动汽车。正如我们将在第三节-C中看到的,驾驶模式预测还基于电动汽车的加速度,而加速度是隐式缩放的,因为它由电动汽车的缩放速度计算得出。
缩放因子的直观解释如下:假设WLTC(DMP由此设计)是车辆V1的驾驶循环,其可达最高速度为120公里/小时。假设我们想要预测其驾驶模式的车辆V2的可达最高速度为80公里/小时。基本的直观想法是,如果在车辆V1上,某一速度曲线SP1对应特定的驾驶模式X,则当车辆V2的速度曲线等于$SP1 \times \frac{2}{3}$时,很可能也应得到相同的模式X,因为$\frac{80}{120} = \frac{2}{3}$。更具体地,如果驾驶模式当V1达到其可达最高速度120公里/小时时,V1的驾驶模式为EH,那么当V2达到其可达最高速度80公里/小时时,V2的驾驶模式也应为EH,因为$80 = 120 \times \frac{2}{3}$。
例如,在未找到错误!参考源的训练数据集中,我们有$V_{train}^{max} = 120$ km/h。从该数据集出发,设计了一个分类器(在本例中为驾驶模式预测器),用于实时确定新行程的驾驶模式,如图4所示的行程。在此示例中,我们有$V_{train}^{max} = V_{EV}^{max}$,即:未找到错误!参考源中的WLTC是针对最大可达速度为$V_{train}^{max} = 120$ km/h的电动汽车获得的,然后根据此WLTC设计驾驶模式预测器,再使用该驾驶模式预测器来预测最大可达速度为$V_{EV}^{max} = 120$ km/h且其驾驶循环如图4所示的电动汽车的驾驶模式。由于$V_{train}^{max} = V_{EV}^{max}$,我们有$v_s(t) = v(t)$,即不存在缩放。将在图8中给出$V_{train}^{max} \neq V_{EV}^{max}$的应用示例,其中$V_{train}^{max} = 120$ km/h且$V_{EV}^{max} = 50$ km/h。
第三节-E小节解释了如何从现有的监督学习算法中选择用于设计驾驶模式预测器的监督学习算法。监督学习算法必须通过记录历史经验的数据集进行训练,该数据集称为训练数据集。训练的结果是得到可用于每辆电动汽车在新行程中预测模式的驾驶模式预测器。在本研究中,我们使用世界轻型车辆测试循环及其相关模式(图3)作为训练数据集,因为它是公认的标准化驾驶循环。
评估分类器质量的标准有多种,例如准确率、精确率、召回率和F值[27]。其思路是将分类器应用于所谓的验证数据集(这些数据集的驾驶模式已知),并将已知模式与分类器预测的模式进行比较。例如,准确率表示在整个验证数据集中正确预测所占的比例。第III-C至III-E小节介绍了所提出的DMP的三步设计。
C. 步骤1:数据集转换
监督学习算法需要一个训练数据集,该数据集记录为一组实例[输入, 输出],其中每个实例的“输出”仅依赖于该实例的“输入”,而不依赖于其他实例的输入。因此,这些实例必须相互独立。
WLTC及其相关模式(图3)被用作训练数据,记录为1801个实例,每个实例由三个特征指定:t(表示时间)单位为秒,v(表示速度)单位为公里/小时,以及m(表示驾驶模式),其取值为L、M、H、EH。“t, v”是输入,m是输出。特征t依次取值为0、1、2、…、1800。一个实例的输出m不仅取决于该实例的输入[t, v],还取决于之前实例的输入(即时间更小的实例)。因此,每个实例[t, v, m]依赖于前面的实例。直观上,当前驾驶模式取决于过去的速度变化过程。这种实例之间的依赖关系使得该数据集结构不适用于监督学习。
为了使我们的数据集适用于监督学习,我们需要将数据集重写为一种实例之间相互独立的形式。如果转换后的数据集中每个实例都将驾驶模式作为输出,并将支持该驾驶模式的所有历史信息作为输入,则可以实现这一目标。
模式。为了确定如何获得满足此目标的转换数据集,我们通过实验确定了以下六个特征作为输入(四个速度和两个加速度):速度特征:瞬时速度v;以及vavg、vvar和vmax,分别为自电动汽车上次启动以来速度的平均值、方差和最大值。加速度特征:瞬时加速度a;以及自电动汽车上次启动以来的加速度aavg。
因此,原始数据集的每个实例[t, v, m]都被转换为[v, vavg, vvar, vmax, a, aavg, m]。通过此转换获得的实例彼此独立,可以按任意顺序存储。
所选特征可以解释为:
- v表示电动汽车的速度随时间变化的点。
- vvar可用于估计速度随时间的离散程度,并有助于快速预测驾驶模式的变化。例如,当vvar从小幅值突然增加时,意味着存在驾驶模式变化。
- a可用于确定检测到的模式变化方向,即模式的增加或减少。
- vavg可用于估计速度聚集区域的中心,从而定位驾驶模式的变化。例如,如果从vvar和a检测到模式增加,则可以从vavg确定其对应的是L→M、M→H还是H→EH。
- vmax有助于估计不可超过的模式。
- aavg通过仅在aavg的绝对值超过阈值时才允许模式切换,从而实现模式的稳定。
D. 步骤2:改进训练数据集中的模式
世界轻型车辆测试循环(WLTC)及其相关模式(图3)被用作初始训练数据集,该数据集由四个连续的驾驶循环组成,对应的时间间隔为:[0, 590],[591, 1023],[1024, 1478],和[1479, 1800],,分别对应低速(L)、中速(M)、高速(H)和极高(EH)模式。然而,我们发现将WLTC及图3所示模式作为监督学习(SL)中的训练数据集时,无法对新经验产生精确的模式预测。我们还观察到,在WLTC的某些时间段内,关联的模式与速度变化不一致。例如,在图3中,从1455到1480秒的时间段内速度为零,但模式却为H。此外,我们注意到驾驶模式在每个四个时间段内不应保持不变。例如,在第四个时间段[1478, 1800],,与其保持相同的EH模式,更合理的做法是逐步升高:低速(L)、中速(M)、高速(H),然后是极高(EH)。因此,我们按照下文所述改进了初始的WLTC训练数据。
我们考虑从WLTC及其图3中的模式在步骤1中获得的训练数据集。我们使用该训练数据集来训练朴素贝叶斯算法[28]。选择朴素贝叶斯是因为即使训练数据集不是很大,它在多类预测中也表现良好[29]。
将从训练中获得的分类器应用于同一训练数据集,从而得到一个略微修改后的数据集,其中某些实例的模式被修改。原始数据集和结果数据集的模式如图5所示。我们可以看到,这些模式通过朴素贝叶斯得到了修正。
分类器在模式与速度变化不一致的区域。
为了获得修改后的数据集,我们仅需使用四个特征v、vavg、vvar和a,而vmax和aavg被忽略。本步骤中使用的原始数据集在四个连续的时间段内具有可持续且稳定的
驾驶模式,分别为低(L)、中(M)、高(H)和极高(EH)。特征vmax和aavg被忽略,因为它们会减缓模式之间的切换。然而,vmax和aavg将在第三节-E小节的下一步中使用。修改后的数据集将用作第三节-E小节中步骤3的训练数据集。这种修改后的训练数据集将有助于提高驾驶模式预测的准确率。
E. 步骤3:驾驶模式预测器的构建
1) 方法
在步骤2中,我们准备了一个修改后的数据集,并将其用作训练数据集。现在,我们首先训练不同的监督学习算法,从每个算法构建一个分类器,然后比较不同分类器的性能。选择性能最优的分类器作为驾驶模式预测器。
在使用修改后的数据集作为训练数据集进行实证实验后,我们注意到步骤2中使用的四个特征(v、vavg、vvar、a)不足以实现准确的分类。经过实证实验,我们确定必须使用以下特征(这些特征在步骤1中已定义,但至今未被使用):vmax和aavg,即自电动汽车上次启动以来的最大速度和平均加速度。我们还注意到,使用修改后的数据集作为训练数据集时,生成的驾驶模式预测器产生的模式波动过于频繁。为获得更高的模式稳定性,我们找到的解决方案是在本步骤3所进行的训练和预测中忽略特征vvar。因此,我们将使用特征[v, vavg, vmax, a, aavg]。
我们考虑了七种监督学习算法[26]:K-最近邻(KNN)、线性判别分析(LDA)、支持向量机(SVM)、多层感知器(MLP)、朴素贝叶斯(NB)、逻辑回归(LR)和决策树(DT)。每种监督学习算法的训练都会产生一个分类器,对应DMP的一个版本。因此,我们得到了DMP的七个版本。为了确定选择哪个版本,应考虑到所设计的DMP必须能够准确且实时地预测任何电动汽车在行程中的驾驶模式。实时性标准不是问题,因为我们已经测试过,模式的预测总是在不到一秒的时间内完成,这对于我们的应用是令人满意的,因为我们的目标是每秒预测一次模式。在下文中,我们仅考虑与准确率相关的性能标准来评估所获得的分类器。
每个监督学习算法的训练均采用10折交叉验证实现,该方法具有多个优点[30]。监督学习算法由超参数表征,其取值会影响最终分类器的性能[31]。因此,确定能够获得最佳性能分类器的超参数配置至关重要。为此,网格搜索(GS)是一种可自动针对不同参数配置训练监督学习算法的方法(每种配置均使用10折交叉验证),并选择能提供最有效分类器的配置[26]。KNN、SVM、MLP和决策树的超参数及我们所使用的参数值如表I所示。表I中的参数值源自先前研究机器学习技术的相关研究[31],[32]。我们未发现调整超参数可提升线性判别分析、朴素贝叶斯和逻辑回归的性能,因此这三个算法均采用单一配置。
表I 监督学习算法的超参数
| 算法 | 超参数 | 默认值 | 网格搜索考虑的值 |
|---|---|---|---|
| KNN | K | 5 | 2, 3, …, 19, 20 |
| SVM | 复杂度 C | 1 | 0.1、1、5、10、50、100、150、200 |
| 核函数 | RBF | 径向基函数, 线性, 多项式, S形函数 | |
| 伽马 | 0.2 | 1,0.2,0.1,0.01,0.001 | |
| MLP | 学习率 | 0.001 | 0.001, 0.1, 0.2, 0.3, 0.4, 0.5 |
| 动量 M | 0.9 | 0.1,0.2 … 0.8,0.9 | |
| 隐藏层 H | 100 | 3, 5, 9, 16, 30, 50, 100 | |
| 训练轮数 e | 200 | 100、200、500、1000、1500 | |
| DT | 最小叶样本数 | 1 | 1, 2, …, 7, 8 |
| 最小分割样本数 | 2 | 2, 3, …, 899, 900 | |
| 最大深度 | 1 | 1, 2, 3, 4, 5 |
每个分类器的性能通过以下指标进行评估:准确率、精确率、召回率、F值[26]和对数损失[33]。这些指标由一个包含4个类别的混淆矩阵CM计算得出,这4个类别对应4种驾驶模式L、M、H和EH(见表二)。在CM中,第i行第j列的元素(其中i和j为L、M、H、EH)表示实际模式为i而预测模式为j的次数。可通过混淆矩阵计算每个类别的真正例、假正例、真反例和假反例:对角线上的元素为4个类别的真正例TPi;类别i的假反例FNi通过将第i行除TPi外的所有元素相加得到;类别i的假正例FPi通过将第i列除TPi外的所有元素相加得到;类别i的真反例TNi通过将混淆矩阵中除第i行和第i列以外的所有元素相加得到。
表二 混淆矩阵
| 预测 | 预测 | 预测 | 预测 | 预测 | |
|---|---|---|---|---|---|
| L | M | H | EH | ||
| Actual | |||||
| L | TP_L | E_L|M | E_L|H | E_L|EH | |
| M | E_M|L | TP_M | E_M|H | E_M|EH | |
| H | E_H|L | E_H|M | TP_H | E_H|EH | |
| 极高 E | E_EH|L | E_EH|M | E_EH|H | TP_EH |
所使用的准确度指标计算如下:
- 总体准确率 = $\frac{\text{sum of coefficients in diagonal}}{\text{sum of all coefficients}}$ 是指预测正确的案例比例。
- 类别i的准确率 = $\frac{TP_i + TN_i}{TP_i + TN_i + FP_i + FN_i}$ 是预测相对于模式i正确的案例比例,即预测正确指定了模式是否为i的情况。
- 类别i的精确率 = $\frac{TP_i}{TP_i + FP_i}$ 是在所有预测为模式i的情况中,模式i被正确指定的案例比例。
- 类别i的召回率(也称为敏感度) = $\frac{TP_i}{TP_i + FN_i}$ 是在所有实际模式为模式i的情况中,模式i被正确预测的案例比例。
- 类别i的F1分数 = $2 \times \frac{\text{精确率}_i \times \text{召回率}_i}{\text{精确率}_i + \text{召回率}_i}$ 是精确率和召回率的调和平均值。
- 类别i的对数损失 用于预测在模式i中预测概率的好坏。结果将在下一小节中讨论。
2) 结果
我们考虑了我们的七种算法,以及另外四种通过网格搜索调优的算法,即KNN、SVM、MLP和DT。然后使用博尔达计数法[34]对这十一个相应分类器的性能进行比较。因此,获得最多第一票的分类器被选为我们的驾驶模式预测器。注意,特征归一化用于MLP、KNN和SVM。
表III 11种算法获得的分类器性能
| 使用默认配置的算法 | 使用默认配置的算法 | 通过网格搜索调优的算法 |
|---|---|---|
| KNN 线性判别分析 支持向量机 多层感知机 朴素贝叶斯 LR DT | GKNN GSVM GMLP GDT | GKNN GSVM GMLP GDT |
| 准确率% | 91.69 83.57 91.22 91.94 89.34 86.63 91.02 | 92.16 92.59 92.84 91.76 |
| F1分数 | 0.9163 0.8192 0.9020 0.9184 0.8869 0.8435 0.9007 | 0.9207 0.9208 0.9266 0.9173 |
| 精确率 | 0.9285 0.8472 0.9265 0.9358 0.8955 0.8615 0.9207 | 0.9326 0.9369 0.9421 0.9290 |
| 召回率 | 0.9169 0.8357 0.9122 0.9212 0.8934 0.8663 0.9097 | 0.9216 0.9259 0.9301 0.9175 |
| 对数损失 | 1.5117 0.5657 0.1704 0.1950 0.6734 0.6720 2.5508 | 1.8385 0.1511 0.2113 1.1022 |
| 时间(秒) | 0.1716 0.0069 0.0468 0.0149 0.0120 0.0059 0.0060 | 0.1595 0.0629 0.0259 0.0070 |
表IV 分类器性能
| 分类器 | 排名 |
|---|---|
| GMLP | 1 |
| GSVM | 2 |
| MLP | 3 |
| GKNN | 4 |
| GDT | 5 |
| 支持向量机 | 6 |
| KNN | 7 |
| NB | 8 |
| 逻辑回归 | 9 |
| 决策树 | 10 |
| 线性判别分析 | 11 |
为了验证我们的驾驶模式预测器,我们针对不同的行程模拟了其使用情况,每个行程通过记录真实或人工行程期间速度变化的数据集(使用MATLAB/Simulink进行仿真)来模拟。图6至图8显示了在三种驾驶循环(NEDC、FTP和ECE)下获得的预测结果[35]–[37],其中速度随时间的变化以蓝色表示,预测模式以红色表示。图4展示了使用记录真实驾驶循环的数据集得到的结果。我们所考虑的驾驶循环涵盖了不同地区、多种车辆类别以及不同的道路类型。从图中可以看出,驾驶模式预测器预测的模式与速度变化一致。此外,由于执行一次模式预测实例所需时间远不到一秒,因此我们能够以1 Hz的频率进行模式预测。因此,也满足了实时性要求。
F. 关于驾驶模式预测器设计与评估的讨论
值得注意的是,用于DMP(如WLTC、NEDC、FTP、ECE)的设计与评估所采用的是从多种车辆获取的实际驾驶循环。因此,所设计的DMP并不局限于单一车辆。DMP是通过对WLTC数据集应用10折交叉验证设计而成的,其中10折交叉验证是一种严格且公认的方法,通过在同一数据集(此处为WLTC)上进行训练和验证阶段来设计分类器(此处为DMP)。在完成DMP的设计(基于WLTC,并如前所述经过训练和验证阶段)后,已在多种驾驶循环中对DMP进行了测试,例如论文中所示的特定驾驶循环(图4)、NEDC循环(图6)、FTP循环(图7)以及ECE循环(图8)。由于所有这些循环(包括WLTC)均非来自同一车辆,因此可以认为DMP的设计与评估不依赖于单一车辆。在过去十年中,已有许多研究使用机器学习来优化混合动力汽车的能耗和燃油经济性。然而,很少有研究针对电动汽车[16]。事实上,现有的相关基于机器学习(ML)的研究主要涉及混合动力电动汽车,尚未发现有关优化纯电动汽车能耗的基于机器学习的研究。速度预测实际上是机器学习应用最为广泛的主题之一,涵盖混合动力或纯电动汽车。通常的方法是使用回归机器学习算法,通过回归任务的准确度指标(如均方根误差RMSE)来预测速度数值。例如,孙等人[38]基于马尔可夫链和神经网络(NN),在七个标准驾驶循环数据集上开展了一项实证研究,用于混合动力电动汽车(HEV)能源管理中的速度预测,并采用RMSE指标评估性能。结果表明,基于神经网络的速度预测器在多种认证和实际驾驶循环中均表现出最佳的整体性能。陈等人[39]提出了一种基于径向基函数神经网络的功率分流式插电式混合动力电动汽车的能量管理策略,并在六个标准驾驶循环数据集上使用RMSE指标评估了所提模型的性能。仿真结果显示,该方法能够提高速度预测的准确率并改善燃油经济性。刘等人[40]应用了确定性和随机性方法,包括自回归移动平均模型、带外部输入的非线性自回归模型、长短期记忆(LSTM)深度神经网络、马尔可夫链以及条件线性高斯模型,用于混合动力电动汽车的未来车辆速度预测。结果表明,LSTM在平均绝对误差指标方面具有最高的准确率。此后,同一作者在[41]中发表了一项改进的实证研究,展示了将[40]中提出的机器学习车辆速度预测模型集成到能量管理系统(EMS)中,以提升混合动力电动汽车的燃油经济性并优化能耗。上述所有研究均针对回归时间序列问题,其输出变量为数值型,通过对速度进行预测以提高能耗和燃油经济性。
本文评估了11种机器学习分类器:KNN、LDA、SVM、MLP、NB、LR、DT、GKNN、GSVM、GMLP和GDT,这些分类器采用Scikit-learn机器学习库提供的默认参数或通过网格搜索调优的参数,用于预测电动汽车的驾驶模式,以最小化电池老化和能量消耗。据我们所知,与上述引用的其他方法相比,我们的主要贡献如下:
- 这是首个研究利用机器学习算法解决基于速度等级(L、M、H、EH)的分类问题(即输出变量为类别型)而非速度连续值,以通过开发驾驶模式预测器(DMP)来最小化电动汽车能耗的工作。我们的驾驶模式预测器(DMP)在参数配置方式上与其他系统不同,即通过网格搜索优化或使用Scikit-learn机器学习库的默认参数值进行配置。
- 所提出的驾驶模式预测器使用经过改进的数据集(第三节-D,图5)进行训练,有助于提高预测模型精度。
- 所提出的DMP在多个实际驾驶循环和数据上进行了比较和验证(例如,图4、6、7和8)。结果表明,在实际驾驶循环中波动显著降低,并在该循环的关键时段实现了86%的峰值电流降低。
G. 仿真环境
本研究有两个主要目标:(i)构建与评估驾驶模式预测器,该目标通过三个步骤实现(第III-C至III-E小节),以及(ii)将所提出的驾驶模式预测器集成到第二节所述的能量管理系统中。此类集成在第四节中进行了阐述。驾驶模式预测器使用Python编程语言实现。我们使用了Python的三个重要开源库:用于科学计算的NumPy、用于数据集处理的Pandas,以及用于机器学习算法和方法的Scikit-learn。我们选择Python是因为它是一种简洁优雅的语言,并且拥有丰富的模块和包,适用于科学计算和机器学习。另一方面,能量管理系统是在另一个环境即MATLAB/Simulink中实现的。因此,我们需要使这两个环境协同工作。为此,我们使用了一个MATLAB函数模块,该模块与Python代码通信以执行驾驶模式预测器,并接收其结果(即预测模式)。
IV- DMP与EMS的集成
DMP被集成到EMS中,以获得基于DMP的能量管理系统,如图9所示。将测得的车辆速度$v_{veh}$和车辆的最大速度$V_{EV}^{max}$输入DMP,以确定驾驶模式L、M、H和EH。随后将这些模式提供给EMS,以计算电池电流参考值$i_{bat}^{ref}$,如第二节所述。所提出的基于DMP的能量管理系统在配备表V参数的电池/超级电容三轮电动车上进行评估。该电池/超级电容三轮电动车使用的主要能源为锂锰电池,混合镍锰钴锂氧化物(NMC),采用18650电池规格,容量为3.5安时,因其可与超级电容器(高比功率)储能装置配合使用而具备高比能量特性。电池包配置基于约束满足问题并扩展为约束优化问题方法的优化多目标框架,并结合Ns/Np表示法[42]进行设计。由于该流程可应用于任何电动汽车,因此采用相同的约束条件和配置问题要求进行参数化。
表V 系统参数
| 参数 | 值 |
|---|---|
| 车辆(eSpyder) | |
| 车辆总质量 $M_{veh}$ | 503 kg |
| 空气动力学标准 $c_x A$ | 0.94 m² |
| 滚动系数 $k_{roll}$ | 0.02 |
| 电池(LG INR18650MJ1单体) | |
| 电池单体标称电压 $u_{电池单体}$ | 3.6伏特 |
| 电池单体容量(1-C) $C_{电池单体}$ | 3.5安时 |
| 电池单体平均串联电阻 $R_{bat cell}$ | 60 mΩ |
| 电池单体最大持续放电 $I_{bat cellcont}$ | 5 A |
| 电池单体最大脉冲放电 $I_{电池单体}$ | 10 A |
| 电池单体最大充电量 $I_{bat c cellh max}$ | 3.4 安 |
| 电池单体荷电状态变化 $SoC_{bat}$ | [95 – 20]% |
| 串联电池单体数量 $n_{s bat}$ | 27 |
| 并联电池单体数量 $n_{p bat}$ | 32 |
| 超级电容子系统(Maxwell BCAP0310 电池单体) | |
| 超级电容器单体电容 $C_{SC}$ | 310 F |
| 超级电容器单体额定电压 $u_{超级电容器额定值}$ | 2.70 V |
| 超级电容器单体平均电阻 $R_{SC cell}$ | 2.2 mΩ |
| 超级电容器单体最大持续电流 $I_{SC cellcont}$ | 41 A rms |
| 超级电容器单体最大电流 $I_{SC cellmax}$ | 250 安 |
| 超级电容单体荷电状态变化 $SoC_{SC}$ | [100 – 50] % |
| 串联电池单体数量 $n_{s SC}$ | 35 |
| 并联电池单体数量 $n_{p SC}$ | 22 |
| 变换器平均效率 $\eta$ | 95% |
为了验证基于DMP的能量管理系统的性能,将新策略与电池电动车(无超级电容)、之前的手动能量管理系统[18],以及作为最优基准的动态规划进行比较。这些案例在四种驾驶循环下进行评估:WLTC(在原始驾驶模式定义的循环)、FTP、交通排放模型与清单系统评估及可靠性(ARTEMIS)乡村道路循环以及真实世界循环。
比较评估结果如图10所示。由于电池电流的均方根(rms)和标准差是影响电池老化应力的关键因素,因此将其作为评价指标。均方根值反映了与热效应相关的影响,而标准差则体现了电池电流波动对寿命造成的影响。总体而言,可以确认:与电池电动汽车相比,采用手动模式选择和基于监督学习的驾驶模式预测(SL-based DMP)的哈密顿最小化策略均能显著降低所考虑的两种电池老化应力因素。结果表明,除了在WLTC 2类工况下测试的情况外,所提出的基于DMP的能量管理系统(DMP-based EMS)性能等于或优于基于手动选择的策略。在实际行驶循环测试中,所提策略使电池电流的均方根值降低了10%,标准差降低了39%。需要注意的是,WLTC 2类工况下的结果并不意味着所提策略存在缺陷,因为在该情况下,驾驶模式实际上是由循环开发者预先定义的[19]。因此,预定义的模式选择得出更优的结果,并且性能非常接近动态规划最优基准(DP optimal benchmark)是合理的。然而,所提出的基于DMP的能量管理系统也接近该最优性能,并在两种老化应力因素方面显著延长了电池寿命。
为了更好地考察所提出的基于DMP的策略的优势,图11给出了在实际行驶循环下的详细结果。四个主要图表分别为速度参考与响应、驾驶模式、超级电容电压以及混合储能系统电流。对350 s至530 s时间段内的这些变量变化进行了放大,以展示能量管理系统控制下系统的典型行为。
第一个子图证实了速度控制器工作正常,车辆速度$v_{veh}$很好地跟踪了其参考值$v_{veh}^{ref}$。该循环在速度和波动方面要求较高。因此,如第二个子图所示,驾驶模式预测器(DMP)识别出车辆主要工作在高功率和超高功率模式。因此,如第三个子图所示,超级电容器需要频繁地充放电,以吸收振荡的电流,从而降低电池的压力。
超级电容器电压$u_{SC}$必须保持在边界范围内,因为其存储能量有限。结果表明,超级电容电压在约束范围内变化,这证实了超级电容器对电池的有效支持。同时验证了电量维持状态得到保证,在驾驶循环结束时,超级电容器被充电至初始电压。
最后一张子图分别用黑色虚线、蓝色实线和红色点划线绘制了牵引电流、电池电流和超级电容器斩波电流。可以看出,牵引电流的大部分波动分量由超级电容器补偿,从而使电池电流变得平滑,变化较小且峰值较低。在图中放大显示的一个最严苛的情况下,峰值电流从435安培显著降低至50安培(降幅达89%)。为此,超级电容器必须快速放电。随后,驾驶模式预测器(DMP)识别到车辆需要非常高的功率以加速进入高速范围,因此将驾驶模式从高切换至超高速(EH)。这会增加电池电流,以防止超级电容器继续放电。之后,当车辆减速时,电池帮助将超级电容器充电至其初始电压。
V- 结论
我们研究了具有两种能源的电动汽车(EV):电池和超级电容器。所采用的能量管理策略(EMS)旨在根据驾驶模式协调电池和超级电容器,以最小化电池退化和能耗。我们考虑了一种现有能量管理策略,其中驾驶模式由驾驶员在实时手动确定。我们的首个贡献是开发了一个称为驾驶模式预测器(DMP)的模块,用于实时自动识别驾驶模式。DMP采用机器学习(ML)技术设计,并通过网格搜索优化方法改进所选的机器学习技术,以构建高精度的DMP。所得到的DMP预测精度高达92.84%。本DMP的优势在于可适用于任何电动汽车的驾驶模式预测。
随后,我们将DMP集成到手动EMS中,从而获得基于DMP的自动能量管理系统。该新型基于DMP的能量管理系统已通过与电池电动汽车、手动EMS以及作为基准的动态规划(DP)进行对比验证。结果表明,所提出的方法在实际驾驶循环中实现了最高达39%的电流波动降低,在该循环的关键时段内峰值电流降低了89%。这将有助于显著延长电池寿命。
贡献的详细列表在引言中给出。据我们所知,这是首个针对纯电动汽车能耗优化的基于机器学习的研究。
正在进行的工作侧重于通过使用特征选择和集成学习器(分为同质学习器和异质学习器)来提高驾驶模式预测器的准确率。我们还旨在利用在线机器学习开发更高效且准确的驾驶模式预测器。此外,能量管理系统的改进将增强混合储能系统的维度。这种策略-规模问题可在未来工作中进行研究。
58

被折叠的 条评论
为什么被折叠?



