一种基于概率的节能巡航控制短期速度预测方法
摘要
许多汽车控制系统依赖于对被控车辆或附近其他道路使用者速度的预测。对于模型预测控制策略的设计和运行而言,预测是不可或缺的,例如在巡航控制系统中用于优化燃油经济性。本文提出并分析了一种新的速度时间序列预测方法,该方法仅依赖于历史速度测量数据。该方法基于从实际驾驶数据中估计得到的加减速条件概率。所提出的速度预测被应用于一种针对重型车辆的自适应巡航控制系统的新模型预测控制算法中,该算法需要前车未来速度的预测及其概率分布。仿真结果表明,精确的速度预测对于实现能效目标至关重要。
索引词
速度预测,广义线性模型,自适应巡航控制。
一、引言
D UE 随着公众气候意识的增强和日益严格的法规要求,汽车行业需要进一步降低其车队的能耗。为此,近年来针对汽车应用的模型预测控制(MPC)引起了越来越多的关注(见[1])。与其他控制技术不同,模型预测控制不仅利用当前信息,还通过考虑相关状态的未来演变进行前瞻性规划。研究表明,这能够实现更高的能效和更好的驾驶舒适性(例如见[2]–[5])。MPC的另一个显著优势是能够处理状态和输入约束。
许多模型预测控制的变体已成功应用于各种汽车控制任务,例如发动机和进气路径控制(见[6],[7])。特别是在高级驾驶辅助系统(ADAS)和自动驾驶领域,模型预测控制最近受到了广泛关注。例如,在[8],中提出了一种考虑不确定环境风险的自动驾驶汽车随机模型预测控制框架。大量关于巡航控制的研究已经开展。在[5]和[9]中,作者设计了一种预测控制方法,用于处理自适应巡航控制系统(ACC)中的车道变换和切入操作。在[2],中,使用机会约束模型预测控制设计了预测巡航控制系统。在[10]中利用交通信号灯信息以减少行驶时间和燃油消耗,而在[11]中部署了模型预测控制实现对慢速车辆的自主超车。
在混合动力汽车(HEV)的能量管理系统领域,模型预测控制(MPC)还有其他常见应用。例如,在[12]和[13]中提出了多种非线性模型预测控制公式,并利用动态规划进行求解,以调节混合动力车辆的动力分配,从而在维持荷电状态参考值的同时优化燃油消耗。这两项工作均得出结论:与非预测性控制算法相比,所讨论的方法能够提高燃油经济性。另一种替代方法在[14]中提出,该方法避免了直接进行速度预测的需求,而是采用神经网络根据输入驾驶循环信息输出控制动作。
所有模型预测控制算法的一个共同关键要求是需要一个模型,用于预测某个变量在特定控制时域内的未来发展趋势。在汽车应用中,通常需要获取被控车辆或附近车辆未来的功率需求、位置或运动信息。根据具体应用场景,这些车辆的未来轨迹可能是未知的,因此需要进行预测。在大多数情况下,这归结为对速度预测的需求。
车辆的行驶速度显然受到多种外部因素的影响,例如交通状况和法规、速度限制、道路曲率和坡度、天气或驾驶员偏好。由于在可用测量数据方面存在许多不同的设置,以及车辆是否以某种信息流拓扑与其他车辆或环境相连,因此已提出并应用了多种方法来解决上述汽车控制问题。
其中最基本的方法之一是加速度指数衰减,该方法假设在给定当前加速度 a(t)的情况下,未来加速度 aˆ(t+ τ) τ> 0 由 aˆ(t+ τ) = e−λτ a(t) 确定,其中 λ 为一个常数且正值。利用未来加速度和当前速度,可以预测未来速度。该预测方法的优点在于其简单性,并且仅依赖于对当前速度和加速度的测量数据。其缺点也显而易见:即使车辆刚刚开始加速,加速度也总是被预测为下降。该方法不存在速度依赖性,也不使用历史数据。然而,对于极短的时域,这种简单的预测已足以在某些预测控制任务中成功应用(例如参见 [3],[13])。值得注意的是,该预测方法是确定性的,这意味着无需使用随机模型预测控制。
另一种用于速度预测的非常常见的建模方法基于马尔可夫链。马尔可夫链是一种随机过程,由状态(通常通过速度和/或加速度区分)以及它们之间的转移概率组成。其定义特性是假设转移概率仅依赖于当前状态,而与过去无关。然而,也可以引入长度为 n的记忆,使得转移概率受到最近 n个状态的影响。例如,马尔可夫链已被应用于 [2],[15]–[17]中的速度或功率需求建模。在[18],中,作者使用了具有模糊状态的马尔可夫链。然而,对于超过几步的控制时域,后续状态期望值的预测质量并不理想。但一个优点是可以利用分布信息用于随机控制器。此外,仅需要速度测量数据。
机器学习方法能够融合任意离散和连续信息,近年来也受到了一些关注。例如,在 [19]中,采用一种贝叶斯网络,结合历史速度测量和交通灯信息,作为自适应巡航控制的随机模型预测控制的预测方法。类似地,在 [9],[20] 中提出了使用多种输入(如纵向和横向运动)进行车道变换场景下的轨迹预测的贝叶斯网络。另一种流行且有效的方法是人工神经网络。它们被应用于例如[12],[21],[22]。
在 [23],中使用了一种模式识别算法来识别驾驶行为,而在[24],中,作者提出了一种基于交通数据中时空相关性的速度预测方法。在 [25],中提出了一种用于车辆横向运动预测的其他方法,该方法基于横摆率测量,采用旋轮线、三次多项式曲线模型。在[26],[27]和[8],中分别讨论了自回归过程和交互多模型卡尔曼滤波器等其他方法。关于各种预测技术的更详细概述及比较可在[28]–[30]中找到。
然而,上述部分参考文献中使用的详细信息通常无法被控制器获取或仅能部分获取。为了确保模型的通用可部署性,速度预测模型不应依赖这些测量数据,而应仅利用 readily accessible 的速度数据。因此,我们专注于仅使用过去的速度测量数据作为输入的预测方法。一些非常简单的模型假设指数加速度衰减或恒定加速度对于超过几秒的预测时域并无帮助,例如在[28]中所示。在这种情况下,马尔可夫链也未表现出令人满意的性能,并且在10秒预测时域下被神经网络超越,如[30]所示。此外,在[28]中,基于神经网络的预测也位列最佳选项之一。然而,基于神经网络的预测存在一个缺点:难以获得多步预测状态的概率分布。此外,由于神经网络的输出是输入的确定性函数,无法直接生成样本轨迹。另外,神经网络的性能在很大程度上依赖于网络结构的合理设计以及充足的训练数据。此外,拟合过程需要求解一个相对复杂的优化问题。因此,本文的目标是开发一种替代预测方法,其性能与神经网络相当,同时能够简便地提取所有预测状态的分布信息。此外,该算法应能生成任意数量的自然样本轨迹,从而为许多基于驾驶循环的应用(例如[31])提供支持。
为此,本文提出了一种全新的、仅依赖于历史速度测量的随机预测方法。本文所考虑的可用信息和所需的预测量如图1所示。该预测基于离散时间采样的历史速度数据。预测需要包含接下来 Np个时间步的概率分布,其中 Np 为预测时域。从这些分布中可以计算期望值或分位数等统计量,并将其用于合适的控制算法中。所提出的预测方法基于对给定历史条件下进一步加速的条件概率建模。利用仅包含速度测量的实际驾驶数据对这些模型进行参数化。适当的记忆长度会自动调整,从而仅使用相关的信息,而不像高阶马尔可夫链那样固定记忆长度。通过基于建模分布抽取随机加速度,生成一组逼真的未来速度轨迹集合。根据该轨迹集合,估计预测时域内每个时间步的速度分布。该算法基于对加速操作的简单观察,其基本思路与人类驾驶员相似,因此易于理解和解释。
为了演示和评估,将新的预测算法部署在模型预测自适应巡航控制系统中。所提出的自适应巡航控制方法的创新之处在于无需距离参考,车距直接由功率消耗最小化求解得出。速度预测被用作前车未来运动的参考,并基于估计的速度分布计算安全约束。
本文结构如下:在第二节中,推导了新的预测算法,并将其与常见的基于马尔可夫链的预测以及神经网络进行了分析和比较。在第三节中,介绍了自适应巡航控制的模型预测控制,并利用速度预测对前车的运动进行预测。同时还比较了新预测方法对模型预测控制性能的影响与马尔可夫链预测的差异。最后,在第四节中给出了一些结论性评述。
二、速度预测
本节推导并分析了速度预测模型。该模型应用所需的唯一假设是存在历史速度测量数据。此外,模型估计需要以测量的速度驾驶循环作为训练数据。这些驾驶循环除了需包含随时间变化的速度信息外,无需满足其他任何要求。
A. 模型结构
所提出的模型主要预测未来的加速度值。相应的速度轨迹则通过积分获得。一个关键的建模选择是将预测分为两个步骤:
1. 预测车辆将加速、减速或保持匀速。
2. 如果发生加速或减速,则预测加速度值。
这种分离是基于以下观察结果:直接对未来加速度进行建模时,常常会导致对于包含过去速度数据信息的特定特征向量,产生一定的正(或负)期望加速度。这意味着在某些情况下,模型中只可能出现加速,而实际上尽管可能性较小,制动也是一种可行选择。除了使用确定性模型输出外,还可以采用置信区间和预测区间来缓解这一问题。然而,这些区间也常常不包含任何负(或正)值,这意味着该可能性突然制动(或加速)的情况基本上无法通过此类模型支持。如果预测将用于巡航控制等安全关键领域,则这会带来问题。因此,本文选择了上述两步法,如图2所示。在所考虑的时间步,首先使用预计算的概率模型确定一般运动(加速、减速、恒定速度)的概率。这三种一般可能性将被称为场景。根据这些场景概率,随机抽取三个场景之一。在第二步中,从建模分布中为该场景抽取一个随机加速度值。通过图2所示的这种逐步迭代构建方法,生成大量的未来速度轨迹,用于估计未来时间步的速度分布。
上述预测方法及图2中描述的最关键要素是基于特征向量 x(将在下文定义)对下一个离散时间步加减速的条件概率进行建模。记忆的引入对于速度建模非常重要,因为例如加速或减速操作通常持续数秒,而对于重型车辆而言,根据本文所使用的测量的重型车辆驾驶数据作为训练数据,此类操作甚至可能持续整整一分钟。因此,车辆已经连续加速的时间步数包含了关于该加速操作继续或结束的概率的重要信息。减速或恒定速度情况同样如此。因此,这一信息被包含在特征向量中:整型变量s j ,t ∈N中的j ∈{a, d, c}, t ∈N表示在时刻 t车辆当前连续加速、减速或保持恒定速度的时间步数量。由于车辆只能处于加速或减速操作之一,因此这些变量中每次只有一个可以为非零值。
或减速概率 q(xt)。根据这些概率,抽取一个随机场景。然后,抽取与所选场景一致的实际加速度随机值。该加速度用于计算下一个速度值vt+1。新的速度被添加到测量的过去数据中,算法以此更新后的历史数据重新开始。)
或保持恒定速度。例如,如果在时间 t的历史速度测量读数为 time: t −5 t −4 t −3 t −2 t −1 t velocity: 3 4 5 4 3 2, 那么在时间 t处的活动序列为长度3的减速操作,这意味着(sa,t,sd,t,sc,t)=(0, 3, 0)。该序列信息编码了变长记忆。该记忆包含车辆当前处于某一操作状态的持续时间信息。需要注意的是,在特征向量中使用的是操作的长度,而不是例如该操作期间记录的所有速度值。这种序列编码的优势在于,即使是非常长的加速操作也能被轻松考虑,而不会像固定记忆方法那样,在某些情况下因记忆长度过短而导致相关信息丢失。类似结构也出现在依赖主要的历史极值输入的滞回模型中(如[32]中的Preisach模型)。
对于每个 j ∈{a,d,c},存在模型 p j 和 q j ,其中p j 表示在车辆当前处于类型为 j的序列时的加速概率。类似地,q j 是在给定 j条件下车辆的减速概率。包含变量 s j ,t的相应特征向量分别表示为x j ,t。
的其他组成部分 xj,t是当前速度 vt以及最近两次加速度的差值 Δat−1= at−1 − at−2。加速度通过数据近似为 at−1=vt−vt−1 Ts ,其中 Ts为时间步长。可以合理地假设这些变量对加速度概率具有显著影响。例如,如果车辆已经达到了较高速度,则进一步加速的可能性较小。此外,如果加速度正在减小,则车辆很可能即将停止增加速度。在此应用中,特征的选择非常明确,因为它们易于解释,且可用数据仅限于一维速度时间序列。通常,存在许多用于算法特征选择的方法并可被应用。几种技术的概述可在 [33] 中找到。
如果有更多数据可用,也可以将其添加到特征向量xj,t中。例如,可以包含交通信息,如被考虑车辆前方车辆的距离、速度和加速度,以进一步提高预测质量。当前方车辆减速且距离已经较小时,应导致加速概率降低,反之亦然。如果有足够的数据,这些回归变量可以轻松地纳入模型中。然而,在实际实现中,这需要车辆之间相互通信并交换信息的技术可能性。
概率模型pj, qj, j ∈{a, d, c}的响应变量不是速度本身,而是一个变量yj,t ∈{0, 1},它在给定协变量向量xj,t时,成功取值为1,失败取值为0。例如,对于加速度概率模型 pj,成功指的是“下一步加速”,而失败指的是“下一步不加速”。所期望的概率 pj( xj,t)由期望值 pj( xj,t) = E(yj,t) = P(yj,t= 1)给出。
上述说明了普通线性模型yi= xiβ+ εi不能用于以下几个原因:首先,由于yi是二元的,误差 εi也只能取两个值,因此不可能是正态分布。其次,由于 σ2 ε i = σ2 yi = E( yi −E(yi)) 2=pi(1 −pi)依赖于协变量向量 xi,误差方差不是常数。第三,期望输出E(yi)必须位于区间[0, 1],内,而普通线性模型无法保证这一点。
因此,采用逻辑连接函数的广义线性模型(GLM)更为合适。这通常被称为逻辑回归。关于广义线性模型( GLMs)的大类概述,读者可参考[34]–[36]。一般而言,广义线性模型包含三个组成部分:
i) 响应变量的分布 yiii)
ii) 线性预测器函数 η= β0+ β1x1+ ···+ β p x p
iii) 一个可能非线性的连接函数 g,它通过 μ= g − 1 (η)建立预测器 η与期望响应 μ= E(y)之间的关系
在本例中,变量 yj ,t 服从伯努利分布。线性预测器依赖于特征向量的变量以及未知的相应参数向量 β。连接函数 g 为 logit 函数,这是伯努利数据的常用选择。因此,这些模型具有以下形式
E[yi]= pi= g−1(xiβ), with g(p)= ln( p 1 −p). (1) 由于 g−1(η)= eη
通常,广义线性模型与标准线性模型不同,且比后者更合适,因为在拟合之前将变换 g 应用于输出变量。除了误差分布假设的明显差异外, g 非线性带来的一种结果是 g(E[y]) ≠ E[g(y)], 其中,等式左侧指的是广义线性模型(GLMs),而右侧表示输出变量经过g变换的普通线性模型的模型输出。这意味着,在普通线性模型的情况下,无法通过简单地计算非线性变换 g的逆函数来无误差地获得期望的未变换输出。此外,对 y应用g也会改变误差分布,从而导致违反正态性假设。总之,正如其名称所示,广义线性模型( GLMs)更加通用且灵活。基于这些逻辑斯蒂广义线性模型给出的概率 pj( xj,t) 和 qj( xj,t),抽取下一步时间步的一个随机场景,从而完成该算法的第一步。
在第二步中,根据第一步确定的随机场景抽取一个随机加速度值 at,如图2所示。为此,假设采用截断正态分布,除非所抽取的场景定义了恒定速度,此时加速度必须设为0:
- accelerate: at ∼N(0,∞)(at−1, σ j(x¯j,t) 2)
- decelerate: at ∼N(−∞,0)(at−1, σ j(x¯j,t) 2)
- constant: at= 0 (2)
特征向量x¯ j,t和 j ∈{a,d,c}用于确定车辆当前所处的运动序列类型。 NI(μ, σ2)表示均值为 μ、方差为 σ2且限制在区间 I内的截断正态分布。期望值被设为上一次测得的加速度 μ= at−1,以实现模拟轨迹的平滑演化。标准差 σ j (x¯j ,t)通过广义线性模型(GLM)进行估计,该模型假设服从正态分布,并以对数作为连接函数。选择此方法是为了确保ˆσ> 0。对于标准差模型σ j(x¯j ,t)的估计,将连续速度数据分组为由分类变量v c描述的若干个区间。特征向量 x¯ j ,t包含 s j , s 2 j , v c以及所有分类变量与非分类变量之间的交互项。
B. 参数识别
训练数据包含大约100小时的实际驾驶数据。测量的驾驶循环仅涉及速度时间序列,且全部在重型车辆上记录。在估计子模型之前,必须对数据进行处理,使得每个时间步都与变量 yj ,t ∈{0, 1} 相关联。且sj,t ∈N j ∈{a, d, c}。这分别针对加速度、减速度和恒定速度进行。例如,对于给定的速度数据,加速序列对应的变量变为 vt: 10 10 11 13 15 18 18 17 18 18 sa,t: 0 0 1 2 3 4 0 0 1 0 ya,t: 0 1 1 1 1 0 0 1 0 − ,
此外,每个yj,t的协变量向量其余部分xj,t也被存储。该过程针对三种类型的序列以及加速度和减速情况分别作为“成功”进行处理,从而得到六个模型 pj, qj,对应 j ∈{a, d, c}。
所有六个模型及所使用的协变量均列于表I中。表I最后两列中的特征用于正则化,以使高速(低速)时的加速(减速)概率为0。当 v< vmax时,项 e(v−vmax)k接近于 0,但当速度大于 vmax时迅速增加。通过负的 β参数,这将迫使加速概率趋近于零。类似地,e1/v可防止车辆在静止时减速,从而避免倒车运动。
广义线性模型(GLMs)基于假设的伯努利分布,采用最大似然法进行估计。在图3和图4中展示了模型 pa的一些示例性建模结果:图3说明了在给定当前加速度序列长度 sa、当前速度 v以及上一次加速度变化Δa的情况下,下一步时间步的加速概率;图4展示了整个速度范围内的概率。注意,正则化项选择 vmax= 80km/h,因为这是训练数据中的相关速度限制。此外,一个时间步的步长定义为Ts= 1s。
模型σj(x¯j,t)也通过最大似然方法进行估计。这完成了所有必要的估计步骤。按照图2所示并如上所述的工作流程,可以生成大量长度为 N p的 M轨迹,其中 N p为预测时域。这样,在从 t+ 1到 t+ N p的每个未来时间步,都会生成一个速度分布。对于确定性预测,例如可使用每个时间步的期望值(均值)。
最后,该预测过程(以下简称条件加速度预测( CAP))在算法1中进行了总结。
C. 分析
使用一条与训练数据中所用卡车相似的卡车记录的验证驾驶循环对所提出的预测方法的性能进行评估。图5展示了CAP方法、马尔可夫链和神经网络获得的结果。图中还描绘了遵循算法1的CAP方法生成的一些示例速度轨迹,以及通过模拟状态为离散速度值的马尔可夫链生成的一些轨迹。此外,还展示了基于1000条模拟轨迹在20秒的预测时域上的速度预测结果。在这两种情况下,预测结果是 ⋯⋯的平均值
神经网络的输出。生成的轨迹从 t= 25s开始,到该时间点为止的测量速度可作为三种预测方法的输入。马尔可夫链仅使用最后一个速度值,而神经网络具有11个时间步的固定记忆长度。相比之下,CAP方法通过设置输入变量sa, t= 25,利用了被考虑车辆在过去25个时间步持续加速的信息。因此,CAP方法在不直接使用过去25个实际速度值作为输入的情况下,实现了自动调整的记忆。可以看出,CAP方法生成的轨迹比其他两种方法更接近自然驾驶数据,包含了持续加速和减速操作,以及匀速行驶阶段。马尔可夫链生成的轨迹不切实际的粗糙,并未体现出CAP轨迹中所包含的多样的驾驶特性。当然,在这两种情况下,由于这些轨迹只是随机实现,无法期望单个轨迹能够长期准确预测实际未来速度。在此例中,神经网络的输出在初始阶段具有较好的预测质量,但长期来看其轨迹看起来并不够自然。
生成大量轨迹,可以估计每个未来时间步的速度分布。在图6中,展示了循环以及多个时间点的预测。对于CAP 和马尔可夫链,预测结果是基于 M= 1000生成轨迹所估计的相应分布的均值。而对于神经网络,其预测结果直接由网络输出给出。可以看出,与马尔可夫链相比,提出的预测方法CAP能够准确预测持续加速和减速操作。马尔可夫链无法合理预测车辆运动,且无论当前状况如何,其预测行为都非常相似。这是由于马尔可夫链的稳态分布在长期运行中决定了期望值,与历史无关。此外,所选马尔可夫链的最小记忆长度无法生成持续加速操作。因此,无论历史速度如何,所有预测都会迅速趋于稳态分布的恒定期望值。另一方面,神经网络在短时域内的预测表现非常好,与CAP的预测类似。对于更长时域,可以看出CAP预测的加速或减速操作比神经网络更长。加速度的突变无法通过任何方法可靠地预测,这是因为预测中仅使用了历史速度数据,未利用其他信息。
然而,不同的驾驶行为的可能性包含在对未来速度值的预测分布中,图7展示了CAP预测的这些分布。需要注意的是,神经网络并未提供此类分布信息。显然,未来速度的不确定性随着时间增加。虽然接下来几个时间步的速度方差相对较小,但对于较长预测时域,估计密度函数变得更宽。图7还显示了速度分布的5%和95%分位数,它们指示了基于当前数据可预期的最快和最慢轨迹。
CAP方法、无记忆马尔可夫链和神经网络的预测性能定量比较见表II。针对不同的预测时域Np,基于图6所示的验证循环计算了加权和平方误差均值除以预测长度 m(Np)的结果:
$$
m(Np)= \frac{1}{Np(M - Np)} \sum_{t=0}^{M-N_p} \sum_{l=1}^{N_p} (1 - \alpha)^l(\hat{v}
{t,t+l} - v
{t+l})^2, \quad (3)
$$
其中 M是循环的长度, $\alpha= 0.05$是权重的指数衰减,$\hat{v}_{t,t+l}$表示基于时间 t的信息对时间 t+ l的预测速度。由于近期的预测质量被认为更为重要,因此在普通平方误差均值中加入了折扣因子 $\alpha$。
显然,正如图6所示,与基于马尔可夫链的预测相比,使用CAP或神经网络对接下来的几个时间步长进行预测具有更高精度。在更长时域情况下,性能指标受到突然制动或加速情况的影响,而这些情况无法通过均值来预测。在这种情况下,新的CAP方法大多预测会进一步加速,而马尔可夫预测在所有情况下都预测为几乎恒定速度。在这些情形下,尽管马尔可夫链预测的结果并不十分有意义,但其平方误差和却更低。这解释了为什么表II中计算出的 $m(Np)$ 的改进程度随着预测时域的延长而减小。神经网络在短时域具有最佳的预测性能,但在较长预测时域下,CAP方法表现更好。这是因为在长期情况下,神经网络的预测变得越来越没有意义,如图5所示。
然而,神经网络的一个优势是生成预测所需的计算时间较短,与其他两种方法相比尤其如此。每个时间步仅需对神经网络进行一次评估,而其他方法则需要通过迭代构建多条轨迹来计算均值以进行预测。然而,额外的计算开销带来了分布信息的优势。然而,CAP方法在标准办公计算机上也容易具备实时能力。因此,在实际车辆中实现也不应成问题,因为自动驾驶汽车所使用的计算设备通常比办公计算机强大得多,这是由于其他ADAS应用需要快速图像处理。此外,即使实时能力确实成为问题,也有多种方法可以降低CAP方法的计算负担。由于生成的各个轨迹彼此独立,因此它们也可以并行生成,这将大大减少总体计算时间。另外,如有必要,始终可以选择使用较少轨迹进行预测估计。最后,建模时可采用更大的采样时间,从而减少迭代次数和计算量。
总之,所提出的CAP预测方法能够以高精度预测持续加速、减速和恒定速度操作。仅在发生从加速到减速或反之的快速切换时,预测会出现偏差。然而,这类操作的可能性至少已包含在预测的分布中,这对于安全关键应用至关重要。神经网络在短时域内具有非常好的预测质量,但在较长时域上的表现不如CAP。此外,神经网络无法直接提供分布结果。
III. 自适应巡航控制系统中的模型预测控制
作为所提出的CAP方法的应用,本文介绍了一种用于自适应巡航控制的新型模型预测控制公式。自适应巡航控制不仅被视为提高生活质量的技术,而且由于更小的车间距,还可作为降低车辆能耗和提升交通通行能力的手段。其任务是使配备自适应巡航控制的被考虑车辆(自车)能够自动跟随其前车。通过预测前车未来的运动状态,模型预测控制器可以提前规划,从而高效地控制车辆并降低能耗。
问题描述
控制器设计采用了一个简单的线性车辆模型:
$$
\begin{pmatrix} \dot{s}(t) \ \dot{v}(t) \ \dot{a}(t) \end{pmatrix}= \begin{pmatrix} v(t) \ a(t) \ -\frac{1}{\tau} a(t)+ \frac{1}{\tau} u(t) \end{pmatrix}, \quad (4)
$$
其中 s, v和 a分别为自车的位置、速度和加速度。控制输入 u表示期望加速度, $\tau$为发动机时间常数。模型(4)例如在[37]中通过状态反馈的输入‐输出线性化方法从更复杂的模型推导而来。
通过 $ x(t)=(s(t)\ v(t)\ a(t))^T$,可以表述为一个时间离散模型。
$$
x_{k+1}= Ax_k+ bu_k, \quad (5)
$$
以恒定时间步 $ T_s$,其中 $ k \in \mathbb{Z}$ 为时间索引,$t= kT_s$。
对于控制器,需要根据未来控制输入 $ u_0,…, u_{N_c -1}$ 建立优化代价函数,其中 $ N_c= N_p $ 为控制时域。控制目标为:(i) 最小化预期总机械功,(ii) 提高驾驶舒适性,以及 (iii) 确保车辆跟随。该目标通过最小化这三项成本贡献的加权和来实现。
能耗由空气阻力、滚动阻力和动能组成。由于假设没有可用的环境信息,因此不考虑势能。所有未来的状态变量 $x_k$都依赖于到 $u_{k-1}$为止的控制输入序列。为了表示方便,以下省略对控制输入的依赖关系。因此,控制时域 $N_c$内的总工作权重 $J_W$可以表示为
$$
J_W = W_{airdrag} + W_{roll} + W_{kinetic} \quad (6)
$$
$$
W_{airdrag} = \sum_{k=1}^{N_c} \frac{1}{2} \rho A C_a \left( 1 - \frac{C_b}{C_c + d_k} \right) v_k^3 T_s \quad (7)
$$
$$
W_{roll} = \sum_{k= 1}^{N_c} \mu_R mgv_k T_s \quad (8)
$$
$$
W_{kinetic} = \sum_{k= 0}^{N_c - 1} \frac{1}{2} m(v_{k+ 1}^2 - v_k^2) , \quad (9)
$$
其中 $d_k$是通过$d_k= \hat{s}
{0,k} - s_k$定义的估计车距,而$\hat{s}
{0,k}$是基于当前信息对前车未来位置的预测。这是控制算法中唯一需要预测前车运动的项,其他所有项仅依赖于自车。对未来位置的估计是通过对算法1得到的预测速度进行积分获得的。
其次,舒适性指标被建模为
$$
J_C= \sum_{k=1}^{N_c} (a_k - a_{k-1})^2. \quad (10)
$$
第三,必须强制车辆始终跟随前车。这是通过惩罚预测速度的偏差来实现的:
$$
J_F= \sum_{k=1}^{N_c} (v_k - \hat{v}_{0,k})^2. \quad (11)
$$
通常,考虑的是与期望车距的偏差,而非公式(11)。然而,这会带来如何最优选择该距离的问题,例如在[38]中所讨论的。在此,距离不是一个设计变量,而是直接由优化过程得出:由于公式(11),自车被强制跟随前车,但车辆间距则由能量和舒适性权重准则 $J_W$和 $J_C$隐式确定。类似地,在[39],中讨论了一种隐式产生的距离,其中通过所谓的安全无故障轨迹概念隐式获得最小安全车距。
最后,模型预测控制的优化目标,根据控制序列 $ u=(u_0,…, u_{N_c -1})$,可以总结为
$$
J(u)= \alpha_W J_W+ \alpha_C J_C+ \alpha_F J_F, \quad (12)
$$
具有正权重 $ \alpha_W, \alpha_C$和 $ \alpha_F$。
关于约束条件,我们假设控制输入具有上下限:
$$
u_{min} \leq u_k \leq u_{max}, \quad k= 0,…, N_c -1。
$$
此外,控制必须确保自车不会与前车发生碰撞,即使前车在下一步时间步开始紧急全力制动操作。为此,必须假设前车的最大减速度值是有界的。由于本应用主要针对卡车,因此假设车辆相同,故 $u_{min}$同样适用于前车。当前车在下一步时间步以 $u= u_{min}$开始紧急制动时,自车也可以采取相同的措施。因此,在这种情况下唯一的自由度是当前时刻的控制输入 $u_1$,而唯一未知的是前车在接下来时间段内的运动状态。
下一位置的风险感知估计可通过位置分布的99.9%分位数获得,该位置分布由预测速度分布得出。然后,可以通过以下两个条件计算当前控制输入 $u_0$的上界:(i) 自车的下一位置 $s_k$ 至少位于前车在下一步时间步的位置分布的99.9%分位数之后一个安全缓冲距离 $d_{buffer} = 1$m处;(ii) 此后在整个预测时域内两车均施加 $u_{min}$ 时不会发生碰撞。这将导致一个新的上界 $\bar{u}$用于
下一个控制输入 $ u_0$。因此,所有约束条件可以合并写成如下紧凑形式
$$
\begin{pmatrix} u_{min} \ u_{min} \ \vdots \ u_{min} \end{pmatrix} \leq \begin{pmatrix} u_0 \ u_1 \ \vdots \ u_{N_c-1} \end{pmatrix} \leq \begin{pmatrix} \min{\bar{u}, u_{max}} \ u_{max} \ \vdots \ u_{max} \end{pmatrix} \quad (13)
$$
综上所述,完整的模型预测控制公式如下所示
$$
\min_u J(u)= \alpha_W J_W+ \alpha_C J_C+ \alpha_F J_F \
\text{s.t.: } (13) \quad (14)
$$
模型预测控制(MPC)以滚动时域控制方式实现,这意味着仅将整个优化序列($u^ _0,…, u^ {N_c -1}$)中的第一个控制输入$u^ _0$应用于系统。随后,基于新的测量数据进行新的预测,并计算一条新的最优轨迹。优化过程本身通过梯度下降法执行。上一步输入序列中未使用部分($u^ _1,…, u^* {N_c -1}$) 可用于构建下一次优化的初始解,这种方法通常称为“热启动”。需要注意的是,当模拟轨迹数量 M较小时,前车位置的99.9%分位数估计的方差较大。为了节省计算时间,可以通过对CAP方法进行大规模仿真运行来建立分位数的估计模型。然而,这超出了本工作的范围,因此不再进一步探讨。
B. 结果
由(14)定义的控制器通过模拟一辆卡车跟随另一辆相同卡车进行了评估,后一辆卡车遵循第二节-C和图6中给出的代表性验证循环。该评估使用了三种不同的预测:
a) CAP
b) 马尔可夫链预测
c) 精确(非因果的)
其中,exact 表示使用实际的未来轨迹作为预测,因此这是一种假设性的、非因果的最佳情况场景。需要注意的是,CAP 和马尔可夫预测分别定义为生成轨迹的均值。未将神经网络纳入此比较,因为其预测质量与 CAP 非常相似,且在此情况下无法直接获得约束(13)所需的分位数信息。所有模型和控制器参数均归类并汇总于表III。
优化权重 $\alpha_W, \alpha_C$和 $\alpha_F$通过经验选取。较大的工作权重 $\alpha_W$意味着更短的车辆距离,但会导致运行不平稳并出现振荡现象。另一方面,过大的舒适性权重 $\alpha_C$会导致车间距过大。根据这些原则,可以通过模拟前导车辆的匀速轨迹来找到有效的标定参数。
三次测试运行的结果如图8所示:右列展示了在控制器配置下可达到的最佳效果,因为使用了完整的非因果信息。在这种情况下,两辆车的速度始终相似,且车距也非常小。事实上,当前车以恒定速度 ∼ 80km/h行驶时,自车能够保持定义的最小距离1米跟随。这是可能的,因为控制器掌握了所有未来的运动信息。在这种假设情况下,自车可以充分利用尾流驾驶的优势,因为车辆总能及时响应前车的操作,从而避免碰撞。当使用所提出的CAP方法而非完整信息时,车距增大,速度差异也随之上升。然而,偏差仍然相对较小,在恒定速度 ∼ 80km/h时车距约为5.5米。此外,最小安全距离从未被违反。相反,若采用马尔可夫链作为预测方法,则会导致两车之间出现较大的速度差异和极大的距离。实际上,该距离变得如此之大,以至于其他车辆很可能切入。控制输入的幅值相似,但使用马尔可夫链预测的控制器最为活跃。
一些性能指标列于表IV中。工作权重的节省对应于自车相对于前车及其预设轨迹所实现的节省。在控制器参数化条件下,可实现的最佳节省为17%。CAP方法实现了9 %的节省,而在测试循环中,基于马尔可夫链的预测仅实现了2%的节省。此外,舒适性项(如(10)中的加速度变化的平方和)在马尔可夫链情况下最高,意味着驾驶舒适性更差。这也是由于预测效果更差所致。错误的预测会导致后续更剧烈的修正。总之,预测的质量极大地影响控制器的性能,不仅体现在效率方面,也体现在驾驶舒适性方面。
四、结论
本文提出了一种用于车辆速度轨迹短期预测的新方法。该模型仅使用历史速度测量数据,不依赖于任何其他数据。模型基于近期和当前状态来估计加减速概率。所涉及的概率采用广义线性模型进行建模,且该模型还可方便地扩展以包含额外的交通流量信息(如果可用)。利用概率和建模分布,结合测量数据模拟大量未来轨迹。这导致在每个时间步直至预测时域内产生速度分布。作为所提出预测模型的一个应用示例,讨论了一种新的自适应巡航控制方法,其中车辆间距不是控制问题的参考值,而是其最优解的结果。使用所提出的预测方法相比常见的基于马尔可夫链的预测能够实现更高的节能效果。
547

被折叠的 条评论
为什么被折叠?



