自动驾驶防御性驾驶策略

混合交通中自动驾驶车辆的防御性驾驶策略与控制

1 引言

智能自动驾驶车辆在提升人类出行便利性、增强交通安全性和实现燃油经济性方面具有巨大潜力[5, 43]。然而,为了实现这一潜力,自动驾驶技术(如感知、决策和运动规划)必须学会如何与人类驾驶的车辆进行交互。近年来,人工驾驶车辆与自动驾驶车辆的混合交通受到越来越多的关注。本章提出了一种新颖的多目标优化算法,用于设计自主地面车辆(AGVs)的防御性驾驶策略和自适应巡航控制(ACC),以在混合交通中避让存在问题的人工驾驶车辆。研究结果来源于大量的计算机仿真。由于交通网络的性能与控制参数之间的关系具有高度非线性、复杂性和随机性,因此在交通研究中使用计算机仿真非常普遍。

自动驾驶车辆的行驶通常分为四个层次[55],即路径规划、轨迹规划、机动选择和轨迹规划。路径规划旨在找到从给定起点到终点的最佳全局参考路径。路径、机动与轨迹规划通常被结合为一个整体,其为自动导引车提供一条沿参考路径的安全且高效的局部轨迹,同时考虑车辆动力学、机动能力、道路结构以及其他交通参与者的影响[24]。本研究假设参考路径由高层规划器提供的先验信息获得。我们为自动导引车设计了一条可行的多目标最优局部轨迹,以安全地跟踪参考路径。在低层控制中,提出了一种PID形式控制,用于自动导引车对前导车辆的跟踪。

1.1 运动规划

最近,模型预测控制(MPC)作为一种在滚动时域框架中应用的最优控制方法,显示出极大的前景,并被广泛用于解决轨迹规划问题[67]。它对不确定性、干扰和模型失配具有较强的鲁棒性。然而,在实时求解优化问题时需要显著的计算量。为应对这一难题,已有大量研究聚焦于基于采样的轨迹规划方法。目前研究了两类轨迹生成方法,即控制空间采样和状态空间采样[18]。

控制空间采样法旨在参数化的控制空间中生成可行的控制。通过微分方程的前向仿真可以生成轨迹。然而,采样过程必须考虑道路环境,这可能导致连续规划之间的差异,以及轨迹跟踪过程中出现超调和振荡[18, 37]。

另一方面,状态空间采样方法选择一组终端状态,并计算连接初始状态和终端状态的轨迹。该方法能够充分利用环境信息。通过使用车辆系统模型[25, 47]进行前向仿真,可以获得符合系统特性的轨迹。本研究采用状态空间采样方法进行轨迹生成。

在自动驾驶车辆轨迹规划中,通常会考虑静态障碍物以避免碰撞。李等人提出了一种集成局部轨迹规划与跟踪控制框架,用于自主地面车辆沿带有障碍物的参考路径行驶。一种基于模型预测控制的路径生成算法被用于生成一组连接初始状态与采样终端状态的平滑且运动学上可行的路径。该算法在[14]中提出,可生成考虑车辆动力学约束、道路结构以及视野范围内不同障碍物的无碰撞路径。尹等人开发了一种结合轮胎模型的模型预测方法用于自主地面车辆的轨迹生成[62]。静态障碍物的信息在其进入有限感知范围并被感知后,将在线纳入非线性模型预测框架中。

在公共道路上,周围交通对自主地面车辆的影响显著。轨迹规划技术需要预测周围交通的行为。一些轨迹规划方法基于周围交通将保持恒定速度[38, 67]的假设。沈及其同事提出了一种能够计算无碰撞参考轨迹[48]的运动规划器。当估计到移动障碍物的路径并检测到未来可能发生碰撞时,系统会重新计算路径以避让碰撞。徐及其同事提出了一种带有轨迹优化的实时自动驾驶运动规划器[60]。魏等人提出了一种运动规划算法,考虑了自动驾驶车辆与周围车辆之间的社会协作[56]。首先在假设道路无障碍物的情况下生成运动学和动力学上可行的路径,随后行为规划器再综合考虑静态和动态障碍物。哈迪等人提出了一种基于优化的路径规划器[15],能够规划多条应急路径,以应对动态障碍物未来轨迹中的不确定性。针对需与其他具有未知意图车辆安全交互的自主地面车辆,研究了概率性碰撞避免问题。

人类驾驶员根据自身对周围车辆行为的经验和判断来决定变道、超车等操作。判断周围车辆的行为(包括驾驶模式、攻击性驾驶以及意图)并调整自身驾驶行为以避让问题车辆,是经验丰富的驾驶员所具备的重要知识。本研究旨在开发一种多目标优化算法,使自主地面车辆具备此类能力。具体而言,在直线路段中对自主地面车辆的跟车和变道行为进行优化,以避让问题车辆。优化目标包括交通效率、交通安全、驾驶舒适性、路径一致性等。本文构建了轨迹规划的多目标优化问题(MOP),同时优化多个驾驶性能目标。

采用细胞映射方法[19](相较于遗传算法等随机算法而言是一种确定性搜索算法)求解该多目标优化问题。多目标优化问题的解在设计空间中形成一个集合,称为帕累托集,对应的目标函数评估值则构成帕累托前沿[44]。本研究可为自主地面车辆在混合交通环境下的智能导航提供有用的工具。

1.2 自适应巡航控制

通常,配备自适应巡航控制的车辆通过传感器(雷达)采集与前车的距离和距离变化率等信息,以保持与前导车辆的期望距离。此外,为了获取道路上车队更丰富的行驶信息,协同自适应巡航控制(CACC)利用无线通信技术与邻近车辆(车辆位置、加速度等)及周边基础设施(交通灯状态等)进行信息交互,例如采用专用短程通信(DSRC)。通过这种方式,配备CACC的车辆能够更快地响应环境变化,实现比自适应巡航控制更精确的跟踪性能。

然而,DSRC设备无法实现信息的瞬时传输,由此引入的通信时延需要被考虑在内。

与传统巡航控制(CC)相比,自适应巡航控制可提供更好的驾驶体验和驾驶便利性[41, 42, 45]。奥罗斯及其同事研究了自适应巡航车辆车队的延迟效应和稳定性[12, 65]。通常,可选择与前导车辆的车头间距和速度差作为自适应巡航控制的输入信号[42]。此外,建议考虑延迟加速度反馈信号,因为它有助于稳定车辆车队,即使在人类驾驶员因反应时间而无法稳定的情况下也能发挥作用[12]。然而,目前可用的自适应巡航控制系统实际上仅侧重于跟踪性能,对其他控制目标关注有限[28],例如驾驶舒适性和燃油经济性。

津川[54]以及伊安努等[3]提出了利用自适应巡航控制降低车辆燃油消耗的方法。针对节能目标,张等人设计了一种基于非线性滤波的PI控制器[64],该控制器对加速度设置了限值,而约翰松提出了一种基于动态规划的离线控制方法[23]以降低燃油消耗水平。根据当前文献综述,自适应巡航控制系统中的多目标优化问题(MOP)尚未得到有效解决。相关目标之间往往相互冲突,例如,对前车的高精度跟踪通常会导致驾驶体验不舒适并增加燃油消耗,而提高燃油经济性则可能以增大跟踪误差为代价。因此,同时考虑多个目标对于自适应巡航控制系统而言极具挑战性。本章提出一种比例‐积分‐微分(PID)控制器用于解决自适应巡航控制中的多目标优化问题,仿真结果表明该控制器在多个目标上均表现出有效性。同时,所提出的控制器也解决了系统的稳定性问题。

目前,模型预测控制已广泛应用于解决自适应巡航控制中的多目标优化问题,但其缺点在于计算负担较大。诺斯等提出了一种系统化的自适应巡航控制控制器设计与调优方法[40]。采用显式MPC方法离线设计控制,结合多个目标和约束,并生成解析解。巴格什瓦尔及其同事[1]使用模型预测控制计算自适应巡航车辆过渡性操作的间距控制律,其中对加速度进行限制以实现驾驶舒适性和安全性。一组较为完整的控制目标包括跟踪误差、燃油经济性、驾驶舒适性和驾驶员期望的行驶特性被李等人[28]用于构建自适应巡航控制的模型预测控制框架。详细仿真已证明了模型预测控制在各种设计目标优化中的有效性。本研究中,将模型预测控制应用于自适应巡航控制系统中作为对比,以展示所提方法的有效性。

迄今为止,关于线性系统的多目标控制设计已有大量研究,但针对非线性系统的相关参考文献却寥寥无几。与单目标优化问题(SOP)不同,多目标优化问题的解由一组最优解组成,称为帕累托集,而不是设计空间中的唯一点。其对应的目标函数值(帕累托前沿)均可被视为最优。许多算法能够获得所需的帕累托集和帕累托前沿[8, 27]。其中,细胞映射方法显示出良好的前景,本文采用该方法求解自适应巡航控制中的多目标优化问题。

本章其余部分首先在第2节简要介绍自动驾驶车辆规划方案。第3节介绍了运动与轨迹规划算法,并给出了交通预测模型和多目标优化方法。第4节提出了PID形式的自适应巡航控制算法,同时提供了稳定性证明、最优设计以及多目标优化方法的公式化描述。所提出的方法在大量不同场景中进行了测试,以验证其有效性。最后在第5节给出结论。

2 自动驾驶架构

示意图0

图1展示了自动驾驶控制的架构。下文将讨论该架构及本研究的假设。

控制架构包含一个动态路径规划模块,该模块利用车载传感器。假设这些传感器能够提供周围车辆的实时信息,例如位置、速度、粗心驾驶、攻击性驾驶等。用于防御性驾驶以避让粗心或激进驾驶者的运动规划算法从图2中的十种可能运动中选择其一。该方法显著降低了轨迹动态优化中的在线计算时间。

在动态轨迹规划中,可通过细胞映射方法同时优化安全性、交通效率、驾驶舒适性等多个性能目标,获得轨迹的帕累托最优集。所有最优轨迹必须满足纵向和横向车辆约束,以确保安全性、稳定性和可控性。多目标优化问题通过滚动时域方式在线求解,以获得下一控制时域的最优设计。控制的时域更新方案如图3所示。预测时域Np和控制时域Nc被假定为恒定值。最终输出是一条期望轨迹,表示自动导引车的时空纵向和横向位置、速度和加速度。

示意图1

示意图2

预测时域应远长于控制时域,从而使控制器能够容忍延迟。这也能提高系统的可靠性,因为即使高层规划器在一段时间内停止工作,底层控制器始终有一条相对较长的轨迹可执行。在下一个控制步长,预测时域向前移动一步,并利用更新的交通信息重新进行优化。该控制系统得益于滚动时域框架,并周期性地接收来自实际交通的反馈,从而使所提出的控制方法对不确定性和干扰具有鲁棒性。

如前所述,假设自动导引车正在传感器范围lsense内收集邻近车辆的实时信息,包括纵向和横向位置、速度和加速度。在时间步tctrl,p=tctrl −tdelay,其中tdelay是为在线计算预留的延迟时间步,基于当前信息开始求解多目标优化问题。最优控制器k(tctrl)假设在控制步长tctrl处得出,其中tctrl=nint × Nc,且nint为整数。预测时域为从tctrl,p起的后续Np个步骤。对未来交通状况采用多种控制设计进行预测,并在控制步长中选用能够实现最优驾驶性能的设计。

最后,我们假设自动导引车的底层巡航控制在非自适应巡航控制模式下能够以高精度跟踪期望轨迹。当处于ACC模式时,将采用所提出的PID形式控制器,相关内容将在后续章节中介绍。

3 运动规划

3.1 交通预测模型

用于交通仿真和预测的模型在文献中广泛可用,此处简要回顾。本研究仅考虑直道情形。车辆被假定在单车道内纵向行驶,并在变道时横向移动。

描述驾驶员如何跟随前导车辆的跟驰模型已经研究了半个多世纪[4, 53]。流行的模型包括智能驾驶员模型[35, 52],加齐斯‐赫尔曼‐罗瑟伊模型[7, 29],安全距离或防撞模型、Helly线性模型、基于模糊逻辑的模型和最优速度模型[2]。在本章中,常用的智能驾驶员模型(IDM)是

示意图3

用于交通仿真和预测,已被许多研究人员验证和校准[35, 52]。IDM能够真实地描述个体驾驶员的驾驶行为以及交通流的集体动力学,例如启停式驾驶波。

在IDM中,车辆加速度a是其速度v、与前导车辆的空间间隙dlead以及与前导车辆的速度差Δv的连续函数。

$$
a= a_{max}\left[1 -\left( \frac{v}{v_{des}} \right)^{\delta} -\left(\frac{d^*(v,\Delta v)}{d_{lead}}\right)^2\right], \quad (1)
$$

$$
d^*(v,\Delta v)= d_0+ t_{gap} v+ \frac{v\Delta v}{2\sqrt{a_{max}a_{min}}}, \quad (2)
$$

其中,$v_{des}$表示期望速度,$\delta$表示一个固定的加速度指数,$d^*$是与前导车辆的期望车头间距,$d_0$是最小安全距离,$t_{gap}$表示偏好时间间隔。

换道模型基于文献中已建立完善的模型[13, 16, 17, 26, 30, 32, 33]。如图4所示,对于目标车辆,令Vehl,l和Vehl,f分别表示左侧相邻车道的前导车辆和后随车辆。Vehc,l, Vehc,f, Vehr,l和Vehr,f分别表示当前车道和右车道中的对应车辆。以右侧相邻车道作为目标车道为例。在时间t,当满足以下条件时,目标车辆的驾驶员有因速度优势而变道的意愿,

$$
v(t)< v_{des}, \quad d_{lead}(t)< D_{free}, \quad \Delta v(t)< \Delta v_{dif,min}, \quad (3)
$$

其中$D_{free}$为距离上限阈值,$\Delta v_{dif,min}$表示最小速度差预设值。

变道前必须检查可行性与安全性,以确保满足以下不等式:

$$
d_{t,lead}(t)> d_{min}, \quad d_{t,fol}(t)> d_{min}, \quad (4)
$$

其中,$d_{t,lead}$和$d_{t,fol}$分别表示目标车道中目标车辆与前导车辆和跟随车之间的纵向间距,$d_{min}$为最小可接受间距。

碰撞时间(TTC)是一个安全性指标,表示两辆车辆在保持当前纵向速度且不进行变道的情况下发生碰撞所需的时间。为了安全地进行变道,要求最小碰撞时间$t_{safe}$满足一定条件,使得

$$
t_{t,lead}(t)> t_{safe}, \quad t_{t,fol}(t)> t_{safe}, \quad (5)
$$

其中,$t_{t,lead}$和$t_{t,fol}$分别表示目标车辆与目标车道内前导车辆和跟随车之间的纵向TTC。此外,目标车道必须为目标车辆提供足够的空间以加速至更高速度。必须满足以下条件:

$$
d_{t,lead}(t)> v(t) t_{extra}, \quad (6)
$$

其中$t_{extra}$为所需的最小车头时距。我们还规定同一车辆连续两次变道之间需满足最小时间$t_{min}$,以防止频繁变道。

在某些模型中,变道持续时间有时被忽略,并将变道过程视为瞬时运动[13, 26, 31]。然而,变道持续时间对交通的影响显著,不可忽视[51]。本研究中,假设每辆车Vehi具有预设的变道时间$t_{i,lc}$,该时间为在区间$[t_{lc,min},t_{lc,max}]$内均匀分布的随机数,其中$t_{lc,max}$和$t_{lc,min}$分别表示最大和最小变道时间。

在变道过程中,横向速度被假定为恒定,而纵向运动遵循IDM。对于当前车道和目标车道中的两辆前导车辆,与目标车辆纵向距离较短的一辆被视为跟驰模型中的前车。

3.2 防御性策略

防御性运动规划为自动导引车应对外部交通环境提供了策略。如图2所示,提出了十种运动模式,以减少轨迹优化过程中的在线计算时间。在纵向方向上,定义了三种模式,即跟随、减速和加速。公式(7)展示了九种运动,由三种纵向运动与三种车道

机动动作(向左车道变换、保持在当前车道、向右车道变换)组合而成。第十种动作为紧急制动动作,用于避让碰撞。

$$
\text{运动}(i)=
\begin{cases}
\text{变道至左车道并减速,} & i= 1,\
\text{保持在当前车道并减速,} & i= 2,\
\text{变道至右车道并减速,} & i= 3,\
\text{变道至左车道并跟随,} & i= 4,\
\text{保持在当前车道并跟随,} & i= 5,\
\text{变道至右车道并跟随,} & i= 6,\
\text{变道至左车道并加速,} & i= 7,\
\text{保持在当前车道并加速,} & i= 8,\
\text{变道至右车道并加速,} & i= 9,\
\text{紧急制动,} & i= 10。
\end{cases}
\quad (7)
$$

防御性运动规划算法如表1所示,用于避让粗心和激进驾驶员。注意,当自动导引车与其前导车辆之间的车距小于安全距离 $d_{safe}$ 时,将触发紧急制动。

粗心驾驶对交通[49]有显著影响,其中包括车辆摆动、近距离切入、频繁变道等。本研究仅考虑车辆摆动行为。在防御性驾驶中,当邻近车辆的摆动幅度Vehwav.Amp超过临界值$d_{wave}$时,自动导引车应避让该挥手车辆Vehwav。我们假设Vehwav可通过自动导引车的车载传感器检测到。

防御性规划器还建议,如果前导车辆较为激进,则不应紧跟其后。若跟随车表现出明显的攻击性驾驶行为,防御性规划器将建议变道以实现礼让,并避让该激进驾驶员。车辆激进程度Veh.Agg通过检测到的最大绝对加速度进行量化。令Vehagg表示前导车辆与跟随车中更具攻击性的驾驶员,当Vehagg.Agg超过临界值$c_{agg}$时,将执行相应的防御性驾驶动作。

如果要求速度优势(见公式(3))且变道可行性条件满足(见公式(4)–(6)),则自动导引车将尝试变道以超车。

自动导引车在前方无前导车辆时会加速,否则将跟随前导车辆。同时规定了连续两次变道之间的最小时间$t_{min}$,以防止频繁变道。

当尝试变道但不可行时,纵向运动会继续进行。

3.3 轨迹规划

一旦确定了防御性驾驶操作,将动态生成短期轨迹。本文提出了一种新的多目标优化算法来寻找最优轨迹。

每个预测时域都会生成一条局部轨迹。设$t_1$和$t_2$分别表示一个预测时域的初始时间和终止时间,$x_0$, $v_0$和$a_0$分别表示自动导引车在位置$(x,y)$时的初始纵向位置、速度和加速度,如图4所示。$v_1$和$a_1$分别表示终止速度和终止加速度。因此,

$$
x(t_1)= x_0, \quad \dot{x}(t_1)= v_0, \quad \ddot{x}(t_1)= a_0, \quad \dot{x}(t_2)= v_1, \quad \ddot{x}(t_2)= a_1.
\quad (8)
$$

注意,$x(t_2)$未指定,而速度和加速度$v_1$和$a_1$可完全确定局部轨迹。因此,我们将$v_1$和$a_1$作为局部轨迹的设计参数。

在横向方向上,当考虑变道时,假设自动导引车在预设时间$t_{lc}$内完成变道。令$y_0$和$y_1$分别表示当前车道和目标车道的中心轴线的横向位置。

$$
y(t_1)= y_0, \quad \dot{y}(t_1)= 0, \quad \ddot{y}(t_1)= 0, \quad y(t_1+ t_{lc})= y_1, \quad \dot{y}(t_1+ t_{lc})= 0, \quad \ddot{y}(t_1+ t_{lc})= 0.
\quad (9)
$$

上述初始和终止条件表明,轨迹$x(t)$在时间区间$[t_1,t_2]$[63]内可以表示为四阶多项式。为了描述时间区间$[t_1,t_3]$内的横向运动,其中$t_3= t_1+t_{lc}$,需要使用关于时间的五阶多项式来表示$y(t)$。

$$
x(t)= \sum_{i=0}^{4} a_i t^i, \quad y(t)= \sum_{i=0}^{5} b_i t^i. \quad (10)
$$

因此,我们有

$$
[x_0, v_0, a_0, v_1, a_1]^T= M_x A^T, \quad (11)
$$
$$
[y_0, 0, 0, y_1, 0, 0]^T= M_y B^T,
$$

其中

$$
A^T=[a_4, a_3, a_2, a_1, a_0], \quad (12)
$$
$$
B^T=[b_5, b_4, b_3, b_2, b_1, b_0],
$$

$$
M_x=
\begin{bmatrix}
t_1^4 & t_1^3 & t_1^2 & t_1^1 & 1 \
4t_1^3 & 3t_1^2 & 2t_1^1 & 1 & 0 \
12t_1^2 & 6t_1^1 & 2 & 0 & 0 \
4t_2^3 & 3t_2^2 & 2t_2^1 & 1 & 0 \
12t_2^2 & 6t_2^1 & 2 & 0 & 0
\end{bmatrix},
$$

$$
M_y=
\begin{bmatrix}
t_1^5 & t_1^4 & t_1^3 & t_1^2 & t_1^1 & 1 \
5t_1^4 & 4t_1^3 & 3t_1^2 & 2t_1^1 & 1 & 0 \
20t_1^3 & 12t_1^2 & 6t_1^1 & 2 & 0 & 0 \
t_3^5 & t_3^4 & t_3^3 & t_3^2 & t_3^1 & 1 \
5t_3^4 & 4t_3^3 & 3t_3^2 & 2t_3^1 & 1 & 0 \
20t_3^3 & 12t_3^2 & 6t_3^1 & 2 & 0 & 0
\end{bmatrix}.
\quad (13)
$$

一个预测时域内的轨迹可以通过求解公式(11)和(12)得到。

3.4 多目标优化

如前所述,我们考虑设计向量 $k=[v_1,a_1]^T$ 以优化局部轨迹。对设计参数施加了以下约束。

$$
0 \le \dot{x}(t) \le v_{max}, \quad (14)
$$
$$
a_{min} \le \ddot{x}(t) \le a_{max},
$$

其中, $\forall t \in[t_1,t_2]$, $a_{max}$和$a_{min}< 0$分别表示自动导引车的纵向最大加速度和减速度,$v_{max}$表示受法定速度限制约束的自动导引车最大速度。当尝试变道时,可根据车道结构和相应约束唯一确定横向轨迹。自动导引车在防御性驾驶中的控制目标包括:(1) 安全性,(2) 交通效率,(3) 驾驶舒适性和燃油经济性,以及 (4) 路径一致性。多目标优化问题(MOP)的解在设计空间中构成一个集合,称为帕累托集,其对应的目标评估结果为帕累托前沿[44]。

安全指标定义为车头时距$t_{th}(t)$与碰撞时间(TTC)$t_{ttc}(t)$之和。车头时距是指前导车辆前端通过道路上某一点到后随车辆前端通过同一点之间的时间间隔。TTC表示若连续车辆保持当前纵向速度不变,则发生碰撞所需的时间。

令$G_{sf}$表示安全性,

$$
G_{sf}= \int_{t_1}^{t_2} (\alpha_{th}t_{th}(t)+ \alpha_{ttc}t_{ttc}(t))dt, \quad (15)
$$

$$
t_{th}(t)= \frac{v(t)}{d_{lead}(t)}, \quad (16)
$$

$$
t_{ttc}(t)=
\begin{cases}
\frac{d_{lead}(t)}{v(t) - v_{leader}(t)}, & v(t)> v_{leader}(t) \
0, & v(t) \le v_{leader}(t)
\end{cases}
\quad (17)
$$

其中$v_{leader}$是前导车辆的速度, $\alpha_{th}$和 $\alpha_{ttc}$表示两项的权重。

在确保安全性的前提下,建议自动导引车在一个预测时域内行驶更长的距离。该距离被用作交通效率的度量,表示为$G_{te0}$。

$$
G_{te0}= x(t_2). \quad (18)
$$

驾驶舒适性$G_{dc}$和燃油消耗的目标通过车辆的纵向加速度和加加速度来衡量,其表达式为[36, 54, 64],如下所示

$$
G_{dc}= \int_{t_1}^{t_2} (\omega_a a^2(t)+ \omega_j \dot{a}^2(t))dt. \quad (19)
$$

其中 $\omega_a$和$\omega_j$表示$a(t)$以及 $\dot{a}(t)$的权重系数。

连续规划之间的不一致性可能导致急剧转向、控制超调甚至不稳定[34]。本研究在轨迹重规划过程中引入了路径一致性约束。2‐范数目标$G_{con}$用于惩罚当前与前一次纵向轨迹之间的不一致性,其定义为,

$$
G_{con}= \int_{t_1}^{t_2} (x(t) -x_{pre}(t))^2 dt. \quad (20)
$$

多目标最优局部轨迹问题被表述为,

$$
\min_{k\in Q} {G_{sf}, G_{con}, G_{dc}, G_{te}}, \quad (21)
$$

其中$Q$是设计参数的有界域,$G_{te}= G_{te,max} -G_{te0}$和$G_{te,max}> 0$是一个很大的数,使得$G_{te}$为正数。此外,我们对$t_{th}(t)$和$t_{ttc}(t)$施加约束,以使驾驶性能保持在可接受范围内。

$$
\max t_{th}(t) \le t_{th,lim}, \quad (22)
$$
$$
\max t_{ttc}(t) \le t_{ttc,lim},
$$

其中 $t_{th,lim}$ 和 $t_{ttc,lim}$ 是预选上限。

3.5 Cell Mapping 方法

简单细胞映射(SCM)方法由胡[19]提出,并由孙及其团队进一步发展[58],用于求解多目标优化问题。细胞映射方法非常适合在设计空间的有限区域内,通过将连续的设计空间离散化为一系列盒子或胞,利用胞映射来搜索多目标优化问题的解[58, 59]。该方法通过胞映射描述搜索过程,在感兴趣的有限区域内进行。

SCM为每个给定的原像单元接受一个像单元。SCM可符号化表示为$z_{k+1}= C[z_k]$,其中$k$为迭代步数,$z_k$是表示系统在第$k$th步所处单元的整数, $C[\cdot]$是由优化搜索策略构建的整数映射。计算感兴趣区域之外的区域称为汇点单元。如果某个单元的像为

在感兴趣区域之外,我们称其被映射到汇点单元。汇点单元始终映射到自身。

SCM最初可以用相对较大的单元来实现。SCM中单元的循环组形成覆盖MOP帕累托解的覆盖集。循环组中的单元可以进一步细分,以提高 MOP解的精度[58]。

3.6 设计优化

有界设计空间被定义为

$$
Q={k \in \mathbb{R}^2\mid [v_{lb}, a_{lb}] \le k \le[v_{ub}, a_{ub}]}. \quad (23)
$$

其中,针对所考虑的自动导引车的四种不同驾驶模式,设定了上下界 $[v_{lb},a_{lb}]$ 和 $[v_{ub}, a_{ub}]$。

  1. 跟随

$$
a_{lb}= -a_f, \quad a_{ub}= a_f, \quad (24)
$$
$$
v_{lb}= \max(v_{lead,p}(t_2) - v_f, 0), \quad v_{ub}= \min(v_{lead,p}(t_2)+ v_f, v_{des}),
$$

  1. 减速

$$
a_{lb}= -a_c, \quad a_{ub}= 0, \quad (25)
$$
$$
v_{lb}= \max(v(t_1) - a_c N_p, 0), \quad v_{ub}= v(t_1),
$$

  1. 加速

$$
a_{lb}= 0, \quad a_{ub}= a_c, \quad (26)
$$
$$
v_{lb}= v(t_1), \quad v_{ub}= \min(v(t_1)+ a_c N_p, v_{des}),
$$

  1. 紧急制动

$$
a_{lb}= a_{min}, \quad a_{ub}= 0, \quad (27)
$$
$$
v_{lb}= \max(v(t_1)+ a_{min} N_p , 0), \quad v_{ub}= v(t_1),
$$

其中,$a_f$和$a_c$表示预设加速度波动幅值$a_c$,$v_f$表示速度波动幅值,$v_{lead,p}(t_2)$表示前导车辆在时间$t_2$的预测速度。预设加速度波动幅值$a_c$、$a_f$、$a_c$和速度波动幅值$v_f$的值根据实验结果确定。

表1 自动驾驶过程的运动规划模块

运动规划算法
周围车辆信息,输出:期望运动规划 $M_d$
1: if $d_{lead}< d_{safe}$
2: $M_d \leftarrow$ 运动(10)
3: elseif $Veh_{wav}.Amp \ge d_{wave}$
4: if $Veh_{wav}= Veh_{l,l}$
5: $M_d \leftarrow$ 运动(2) AND 运动(6)
6: else if $Veh_{wav}= Veh_{l,f}$
7: $M_d \leftarrow$ 运动(8) AND 运动(6)
8: else if $Veh_{wav}= Veh_{c,l}$
9: $M_d \leftarrow$ 运动(2) AND 运动(4) AND 运动(6)
10: else if $Veh_{wav}= Veh_{c,f}$
11: $M_d \leftarrow$ 运动(8) AND 运动(4) AND 运动(6)
12: else if $Veh_{wav}= Veh_{r,l}$
13: $M_d \leftarrow$ 运动(2) AND 运动(4)
14: else if $Veh_{wav}= Veh_{r,f}$
15: $M_d \leftarrow$ 运动(4) AND 运动(6)
16 end
17: else $Veh_{agg}.Agg \ge c_{agg}$
18: if $Veh_{agg}= Veh_{c,l}$
19: $M_d \leftarrow$ 运动(2)
20: else if $Veh_{agg}= Veh_{c,f}$
21: $M_d \leftarrow$ 运动(4) AND 运动(6)
22: end
23: else if 速度需求已满足
24: $M_d \leftarrow$ 运动(7) AND 运动(9)
25: else
26: $M_d \leftarrow$ 运动(5)
27: end

局部运动规划算法如表1所示。在每一步中,我们决定自动导引车是变道至左车道、保持在当前车道,还是变道至右车道。对于每个决策,都会求解一个多目标优化问题。这三个多目标优化问题的帕累托集被合并为一个单一的帕累托集。最优轨迹从该帕累托集中选取。在接下来的数值研究中,我们对设计空间采用了 5 × 5× 5粗略划分,并进行了一次 3× 3× 3的精细化。

3.7 最优设计的选择

为了便于用户从帕累托集中选择一个最优设计进行实施,我们提出了一种在帕累托前沿上操作的算法。设$f_{i,min}$表示帕累托前沿中第$i$个目标的最小值,$f_{i,max}$为对应的最大值。定义一个向量,

$$
F_{ideal}=[f_{1,min}, f_{2,min},…, f_{nobj,min}]. \quad (28)
$$

其中$F_{ideal}$被视为目标空间

混合交通中自动驾驶车辆的防御性驾驶策略与控制

3 运动规划

3.7 最优设计的选择(续)

其中$F_{ideal}$被视为目标空间中的一个理想点,其在每个维度上的目标值均为最小。设$n_s$表示帕累托解的数量。为了消除不同目标量纲的影响,对帕累托前沿进行归一化处理,

$$
\bar{f} {i,j}= \frac{f {i,j} - f_{i,min}}{f_{i,max} - f_{i,min}}, \quad (29)
$$
$$
1 \le i \le n_s, \quad 1 \le j \le n_{obj},
$$

其中$\bar{f} {i,j}$是第$i$个目标函数在第$j$个最优解下的值,而$\bar{f} {i,j}$表示$f_{i,j}$的归一化值。归一化目标向量$F_i$如下所示,

$$
\bar{F} i=[\bar{f} {1,i}, \bar{f} {2,i},…, \bar{f} {n_{obj},i}], \quad (30)
$$

其范数表示为$r_i= | \bar{F} i |$。令$r {max}$和$r_{min}$分别表示帕累托前沿中各点范数的最大值和最小值。

设$n_{per}$表示帕累托集中其对应帕累托前沿范数位于最小的$n_{per}\%$范数中的控制设计所占的百分比。我们将这些设计称为前$n_{per}\%$设计。一组特殊的顶级设计是所谓的膝部点[46],其定义如下:

$$
k_{knee}={k_i \mid i= \min_{1\le i\le n_s} r_i}. \quad (31)
$$

需要注意的是,帕累托前沿有不同的归一化方法,在文献中膝点的定义也可能不同[11, 46],但它们具有类似的控制选择目的。此外,归一化会影响设计方案的分类。本章所采用的归一化方法直观且易于实现。

表2 本文使用的参数

参数 参数 参数
$t_{lc}$ 4 s $l_{sense}$ 150米 $d_{min}$ 2m
$a_{max}$ 5 m/s² $v_f$ 2m/s $t_{safe}$ 2.5 s
$a_{min}$ −8 m/s² $t_{gap}$ 0.8 s $t_{extra}$ 1.5 s
$N_p$ 6 s $D_{free}$ 100 m $t_{min}$ 5 s
$N_c$ 1 s $\Delta v_{dif,min}$ 2 m/s $G_{te,max}$ 3000 m
$t_{delay}$ 0.5 s $\omega_a$ 1 $t_{th,lim}$ 1 s
$t_{lc,max}$ 5 $\omega_j$ 1 $t_{ttc,lim}$ 0.7 s
$t_{lc,min}$ 3 $\alpha_{th}$ 0.1 $c_{agg}$ 3 m/s²
$a_f$ 1 m/s² $\alpha_{ttc}$ 1 $d_{safe}$ 15m
$a_c$ 2 m/s² $D$ 8 veh/km $d_{wave}$ 0.4 m

3.8 实验结果

为了验证所提出的用于局部轨迹规划的多目标优化算法的有效性,我们在不同场景下测试了该算法。本研究中的仿真在Matlab中实现。采样时间步长为0.1秒。本研究的仿真参数列于表2中。本研究的仿真在PC上的Matlab 2015b中进行。

展示防御性驾驶策略的最佳方式是通过自动导引车在包含人工驾驶车辆的混合交通中的动画演示。由于印刷出版物的限制,我们呈现了几个特殊情况,以展示自动导引车如何应对不同的情况。

超车 我们首先展示自动导引车如何执行超车任务。如图5所示,自动导引车 VehA正在接近同一条车道上的前导车辆 Veh1。然而,VehA的期望速度高于Veh1。因此,自动导引车应超车前导车辆以获得速度优势。自动导引车的纵向位置和速度如图6所示。可以看出,自动导引车首先减速以配合Veh1。为了再次达到期望速度,VehA倾向于变道以超车前导车辆。所采用的速度曲线在同时考虑安全性、驾驶舒适性、交通效率和路径一致性的基础上是最优的。横向轨迹平滑。更多数值结果及与其他非最优设计的比较将在后续示例中提供。

避让 接下来,我们展示自动导引车避让摆动车辆的能力。图7显示车辆 Veh3正在摆动。在标号1所示的时间点,自动导引车检测到Veh3的摆动幅度大于安全阈值,遂尝试变道至右车道以进行避让。该运动轨迹综合考虑了与附近所有其他车辆的交互作用(图中未显示),并通过优化在四项性能指标之间取得最佳折衷,从而获得最优轨迹。

道路测试 接下来,选取一个真实的路段来测试所提算法的性能。数值实验在一段长度为3000米的单向三车道道路上进行,边界条件为周期性边界,如图4所示。我们将车辆密度(即每公里每车道车辆数)记为$D$。考虑了具有不同长度和期望速度的随机数量车辆。假设所有车辆中有20%处于摆动状态,其最大摆动幅度在(0,0.8]米的范围内随机确定。仿真实验总时长为1000秒,其中前500秒用于消除瞬态效应的影响。其他参数见表2。

由于与周围车辆的复杂交互,在仿真过程中的不同情况下会做出不同的运动决策。图8展示了在纵向跟车场景中获得的帕累托前沿(Motion(5))在804秒时刻。观察到不同目标之间的冲突特性。选择了在四个目标之间实现平衡折衷的设计。

随着仿真持续至932秒,检测到自主地面车辆在当前车道的后随车辆行为非常激进。规划器试图变道以实现礼让(Motion(4)和 Motion(6))。当向左车道变道不可行,而右车道可用。帕累托前沿如图9所示,并获得了最优轨迹。

在仿真时间952秒时,感知到自主地面车辆在当前车道的跟随车正在摆动。基于运动规划算法,Motion(8)、Motion(4)和 Motion(6)被考虑。右车道不可用,另外两种动作的帕累托前沿如图10所示。可以看出,这两种动作的帕累托前沿彼此相似,在交通效率($G_{te}$)上差异较小。应用最优设计的选择算法,本例中执行了Motion(8)。

当仿真达到969秒时,检测到左车道自动导引车的后随车辆正在摆动。规划器同时考虑在当前车道加速(Motion(8))和向右变道(Motion(6))以进行避让。图11展示了关于这两个运动的帕累托前沿。从上方两幅图可以看出,蓝色的帕累托前沿位于橙色帕累托前沿的左侧。这表明保持在当前车道比变道能实现更高的安全性。在其他目标上,这两种运动之间没有显著差异。因此,采用保持在当前车道的最优轨迹设计。

同样,在时间980s时,观察到左车道的前导车辆正在摆动,规划器必须在 Motion(2)和Motion(6)之间做出决策。帕累托前沿如图12所示。虽然保持在当前车道会显著降低安全性,但最优运动变为向右变道。

在实验中,为简化起见仅考虑直道。但应注意,所提出的运动规划算法可应用于包含弯道的各种道路场景。

4 自适应巡航控制

在本节中,提出了一种PID形式控制器,用于AGV在自适应巡航模式下跟踪前导车辆。

4.1 车辆动力学模型与HVA控制

强非线性车辆纵向动力学模型[66]包括纵向轮胎力、重力、空气阻力、滚动阻力等。然而,在某些假设下可以将其线性化[42, 45]。(1)轮胎滑移可忽略不计,(2)传动轴为刚性的,(3)扭矩转换器处于锁止状态,(4)进气歧管中满足理想气体定律,且进气歧管动态特性远快于车辆动力学。

根据假设,得到以下方程。

$$
\dot{x}(t)= v(t)= R_r \omega, \quad (32)
$$

$$
\dot{v}(t)= a(t)= \frac{R_r}{J}[T_{en} - c_a R_r^3 \omega^2 - R_r(F_r+ T_{br})], \quad (33)
$$

其中$x$表示车辆的纵向位置,$v$和$a$分别为对应的速度和加速度,$R$表示变速器的传动比,$r$为轮胎半径, $\omega$表示发动机转速,$J$是当车辆质量及轮胎惯量折算到发动机侧时发动机的等效转动惯量,$T_{en}$和$T_{br}$分别为轮胎处的发动机净扭矩和制动扭矩,$c_a$为空气阻力常数,$F_r$表示滚动阻力产生的力。因此,发动机扭矩和制动扭矩分别为

$$
T_{en}= c_a R_r^3 \omega^2+ R_r F_r+ \frac{J}{R_r} \dot{v}, \quad (34)
$$

当制动操作停用时,且

$$
T_{br}= - c_a R_r^3 \omega^2+ R_r F_r - \frac{J}{R^2 r} \dot{v}, \quad (35)
$$

当制动操作被启用时。

考虑到发动机模型中的非线性特性,进行了线性化处理[10, 61]。控制律$u$采用如下形式:

$$
T_{des}= c_a R_r^3 \omega^2+ R_r F_r+ \frac{J}{R_r} u, \quad (36)
$$

其中$T_{des}$表示期望净发动机扭矩。根据公式(34)和(35),

$$
\dot{v}(t)= u(t). \quad (37)
$$

如果启用了制动操作,仍然可以得到式(37)。因此,在自适应巡航控制过程中对自动导引车的加速度或减速度进行指令和控制。

连续两辆相同车辆被视为在单车道上行驶,如图13所示,其中$x_p$和$v_p$分别表示前车的纵向位置和速度,而$h= x_p -x$表示相邻车辆之间的车头间距,该间距包含车辆自身长度。

示意图4

本章采用了被广泛接受为驾驶员安全规范且在自适应巡航控制设计中普遍使用的固定时间车头时距(CTH)间距策略。两车之间的期望间距可根据跟随车的当前速度计算得出。

$$
h_{des}= t_{pth} v+ h_0, \quad v \in[0, v_{max}], \quad (38)
$$

其中,$h_0$ 表示车辆在静止状态下可能发生碰撞的最小安全距离,该距离因安全性考量而不被接受,$t_{pth}$ 表示期望的恒定车头时距,$v_{max}$ 表示道路的法定速度限制。自适应巡航车辆的动力学可表示为,

$$
\frac{d}{dt} h(t)= -v(t)+ v_p(t), \quad (39)
$$

$$
\frac{d}{dt} h_{des}(t)= t_{pth} a(t).
\quad (40)
$$

在机械与控制系统中,时间延迟是不可避免的[57]。因此,当控制信号从自适应巡航控制控制器计算并传递给执行器时,实际发动机净扭矩无法立即跟踪期望发动机扭矩[21]。采用一阶系统来建模该时间延迟。设 $\tau$表示由于延迟引起的时间常数。

$$
\tau \dot{T} {en}+ T {en}= T_{des}, \quad (41)
$$

当制动操作停用时,且

$$
\tau \dot{T} {br}+ T {br}= T_{des}, \quad (42)
$$

当制动操作被启用时。在这两种情况下,

$$
\tau \dot{a}(t)+ a(t)= u(t). \quad (43)
$$

此外,本研究未考虑自适应巡航控制控制器的信息与感知时延,这意味着控制器能够获取瞬时信息以产生期望的加速度或减速度。

由公式(37)、(39)、(40)和(43)可知,自适应巡航控制系统可表示为:

$$
\dot{x}= Ax+ E a_p+ Bu, \quad (44)
$$

其中$x \in \mathbb{R}^n$是状态变量,并且

$$
x=[h, h_{des}, v, v_p, a]^T, \quad (45)
$$

$$
A=
\begin{bmatrix}
0 & 0 & -1 & 1 & 0 \
0 & 0 & 0 & 0 & t_{pth} \
0 & 0 & 0 & 0 & 1 \
0 & 0 & 0 & 0 & 0 \
0 & 0 & 0 & 0 & -1/\tau
\end{bmatrix},
\quad
E=[0, 0, 0, 1, 0]^T,
\quad
B=[0, 0, 0, 0, 1/\tau]^T.
$$

为了实现间距策略,提出了一种针对车辆加速度指令的控制器,该控制器考虑了期望车头间距与两车之间当前距离的差异、跟随车的速度跟踪能力以及前导车辆的运动趋势。因此,提出了HVA控制器,分别表示距离、速度和加速度控制,其表达式如下:

$$
u(t)= kx \quad (46)
= k_h(h - h_{des})+ k_v(v_p - v)+ k_a a_p(t - \eta),
$$

其中$k=[k_h,-k_h,-k_v,k_v,k_a]$为控制增益,$a_p(t-\eta)$表示具有无线通信延迟 $\eta$的前车加速度。需要注意的是,即使使用了$a_p$,我们仍倾向于将该控制器称为自适应巡航控制而不是协同自适应巡航控制,因为其主要部分由距离和距离变化率信息组成,而协同自适应巡航控制通常涉及更丰富的无线通信信息。

此外,考虑到驾驶员舒适性,车辆加速度的绝对值不应超过某一预设值[22]。以下方程用于该加速度约束,

$$
a_{min} \le u \le a_{max}, \quad (47)
$$
$$
a_{min} \le a \le a_{max}.
$$

因此,控制公式为,

$$
u(t)= \text{sat}(kx) \quad (48)
=
\begin{cases}
a_{min}, & \text{if } kx< a_{min} \
k_h(h - h_{des})+ k_v(v_p - v)+ k_a a_p(t - \eta), & \text{if } a_{min} \le kx \le a_{max} \
a_{max}, & \text{if } kx> a_{max}
\end{cases},
$$

其中$\text{sat}()$是一个标准的饱和函数。

自适应巡航控制设计需要满足两个稳定性准则,即系统稳定性和弦稳定性。由于假设车队中的车辆为相同车辆,我们针对两个连续的相同车辆进行稳定性分析。值得注意的是,由于控制信号的系统约束(公式(47)),系统还必须在执行器饱和条件下保持稳定。

系统稳定性 设$S$为对称多面体,

$$
S(k)={x \in \mathbb{R}^n: |kx| \le 1}. \quad (49)
$$

$D$被定义为一组对角矩阵,其对角线元素为$0$或$1$。$m$被引入作为控制输入变量的维度,即$u \in\mathbb{R}^m$,显然在本研究中$m= 1$。因此,

$$
D={D_1, D_2}, \quad (50)
$$

其中$D_1= 1$和$D_2= 0$[6]。补集为$D^{-1}= 1 -D_1= 0$和$D^{-2}=1 - D_2= 1$。

引理1 ([6, 20]) 给定$k$,$H \in\mathbb{R}^{m\times n}$,以下关系

$$
\text{sat}(kx) \in \text{Co}{D_i kx+ D^{-i} Hx:i \in[1, 2^m]}, \quad (51)
$$

适用于$x \in S(H)$。

引理表明,如果$|Hx| \le 1$,饱和函数可以用凸组合表示为

$$
\text{sat}(kx)=
\sum_{i=1}^{2^m} \mu_i(D_i k+ D^{-i} H)x, \quad (52)
$$

其中$0 \le \mu_i \le 1$和$\sum_{i=1}^{2^m} \mu_i= 1$。

需要注意的是,为简化起见,本章假设$a_{min}$和$a_{max}$的绝对值相同。

$$
|a_{max}| = |a_{min}| = a_{lim}, \quad (53)
$$

其中$a_{lim}$为对应的加速度限值。公式(44)可重写为

$$
\dot{y}= A y+ E \tilde{a}_p+ B \tilde{u}, \quad (54)
$$

其中

$$
y= \frac{x}{a_{lim}}, \quad (55)
$$

$$
\tilde{a} p= \frac{a_p}{a {lim}},
\quad
\tilde{u}= \frac{u}{a_{lim}},
\quad
\max | \tilde{u}| = 1.
$$

系统稳定性要求当前车以恒定速度行驶时,跟随车的速度扰动应逐渐衰减,直至系统达到平衡。考虑公式(54),并为系统定义一个李雅普诺夫函数,

$$
V= y^T P y, \quad P> 0. \quad (56)
$$

其时间导数结果为,

$$
\dot{V}=[A y+ B \tilde{u}]^T P y+ y^T P[A y+ B \tilde{u}]. \quad (57)
$$

鉴于饱和函数可以由凸组合[9]表示,其中$i= 1, 2,…, 2^m$,

$$
\dot{V}= \sum_{i=1}^{2^m} \mu_i y^T {[A+ B(D_i k+ D^{-i} H)]^T P+ P[A+ B(D_i k+ D^{-i} H)]} y, \quad (59)
$$

这表明如果

$$
[A+ B(D_i k+ D^{-i} H)]^T P+ P[A+ B(D_i k+ D^{-i} H)]< 0, \quad (60)
$$

对于$i= 1,2,…, 2^m$,则$\dot{V}< 0, \forall y \in \varepsilon\setminus{0}$其中

$$
\varepsilon={y \in \mathbb{R}^n: y^T P y \le\gamma}, \quad \gamma> 0. \quad (61)
$$

所得的LMI(线性矩阵不等式)条件(公式60)可轻松通过Matlab中的LMI工具箱求解。因此,系统稳定性判据(公式(60))在未饱和和饱和情况下均得到满足。

弦稳定性 在均匀流平衡状态下,车队中的所有车辆具有相同的速度$v^ $和车头间距$h^ $。

$$
h= h^ , \quad h_{des}= h^ , \quad v= v^ , \quad v_p= v^ , \quad (62)
$$

受约束于公式(38)。

$$
h^ = t_{pth} v^ + h_0, \quad v^* \in[0, v_{max}]. \quad (63)
$$

令$\tilde{h}(t)= h(t) -h^ $, $\tilde{h} {des}(t)= h {des}(t) -h^ $, $\tilde{v}(t)= v(t) -v^ $和$\tilde{v}_p(t)=v_p(t) -v^ $分别表示状态相对于平衡的扰动。将式(46)代入式(44),

$$
\frac{d}{dt}
\begin{bmatrix}
\tilde{h} \
\tilde{h} {des} \
\tilde{v} \
\tilde{v}_p \
a
\end{bmatrix}
=
\begin{bmatrix}
0 & 0 & -1 & 1 & 0 \
0 & 0 & 0 & 0 & t
{pth} \
0 & 0 & 0 & 0 & 1 \
0 & 0 & 0 & 0 & 0 \
\frac{k_h}{\tau} & -\frac{k_h}{\tau} & -\frac{k_v}{\tau} & \frac{k_v}{\tau} & -\frac{1}{\tau}
\end{bmatrix}
\begin{bmatrix}
\tilde{h} \
\tilde{h}_{des} \
\tilde{v} \
\tilde{v}_p \
a
\end{bmatrix} \quad (64)
+
\begin{bmatrix}
0 \ 0 \ 0 \ 1 \ 0
\end{bmatrix}
a_p(t)+
\begin{bmatrix}
0 \ 0 \ 0 \ 0 \ \frac{k_a}{\tau}
\end{bmatrix}
a_p(t-\eta)
$$

其中$\tilde{v}_p$被视为系统输入,而$\tilde{v}$是输出。传递函数可通过对方程(64)进行拉普拉斯变换得到:

$$
\Phi(s)=
\frac{k_a e^{-\eta s} s^2+ k_v s+ k_h}{\tau s^3+ s^2+(2k_h+ k_v) s+ k_h}. \quad (65)
$$

如果速度在车队中传播时围绕平衡点的波动逐渐减小,则可以确保弦稳定性[50]。这意味着$|\Phi(j\omega)| < 1, \forall\omega> 0$必须满足,这等价于

$$
\alpha_1^2+ \alpha_2^2 - \beta_1^2 - \beta_2^2< 0, \quad (66)
$$

其中

$$
\alpha_1= k_h - k_a \omega^2 \cos\eta\omega, \quad (67)
$$
$$
\alpha_2= k_v \omega+ k_a \omega^2 \sin \eta\omega,
$$
$$
\beta_1= -\omega^2+ k_h,
$$
$$
\beta_2=(t_{pth}k_h+ k_v) \omega - \tau \omega^3.
$$

此外, $\omega$在(0, 10]范围内为弦稳定性被任意检查,而本研究不关注饱和控制器系统的弦稳定性。

4.2 自适应巡航控制的多目标优化

通常,自适应巡航控制的多目标优化问题考虑多个目标作为控制目标,包括驾驶安全、舒适性和燃油经济性。根据间距策略,安全性目标应与跟踪期望轨迹的能力以及前车速度[39]相关。在本节中,采用跟踪误差的2‐范数来量化安全问题。

$$
G_{th}= \int_0^{t_s} (h - h_{des})^2 dt, \quad (68)
$$

$$
G_{tv}= \int_0^{t_s} (v - v_p)^2 dt, \quad (69)
$$

其中$G_{th}$和$G_{tv}$分别表示车头间距和速度的跟踪误差目标,$h_{des}$是基于CTH间距策略(公式(38))根据当前速度确定的期望车头间距,$t_s$为仿真时长。

驾驶舒适性通常与车辆纵向加速度中振动或振荡的次数、幅度和频率相关。同时,最大减速度也常与舒适性相关。此外,加加速度值被认为会影响驾驶员舒适性[36]。除了关注驾驶员体验外,燃油消耗也被建议作为主要考虑因素通过车辆加速度,而不考虑发动机工作区域[54, 64],这也与舒适性目标相关。与其他具有相同行驶距离和平均速度的车辆相比,绝对加速度较大的车辆 tends to 消耗更多燃油。我们可以看到,在公式(43)中,车辆的加速度指令与实际加速度值彼此相似。因此,关于驾驶舒适性和燃油经济性的目标量化可以定义为两个L2控制指令及其导数的范数函数,

$$
G_u= \int_0^{t_s} u^2 dt, \quad (70)
$$

$$
G_{du}= \int_0^{t_s} \dot{u}^2 dt. \quad (71)
$$

自适应巡航控制的控制多目标优化设计可以表述为,

$$
\min_{k_Q \in Q} {G_{th}, G_{tv}, G_u, G_{du}}, \quad (72)
$$

其中$k_Q=[k_h, k_v,k_a]$和$Q$为具有边界的增益空间。值得注意的是,在计算$G_{tv}$时,$v$、 $v_p$的单位为米/秒。

此外,还需要对目标函数的值设置适当的约束,以将控制性能保持在一定距离范围内。

$$
\max G_{th} \le G_{th,lim}, \quad (73)
$$
$$
\max G_{tv} \le G_{tv,lim},
$$
$$
\max G_u \le G_{u,lim},
$$
$$
\max G_{du} \le G_{du,lim},
$$

其中$G_{th,lim},G_{tv,lim},G_{u,lim},G_{du,lim}$为相应的限值。本研究也采用了细胞映射方法。

4.3 模型预测控制

下文[28]给出了自适应巡航控制的MPC算法的简要描述。注意,MPC算法通常在离散时间域中设计,因此模型可以表述为:

$$
\hat{x}(k+ 1)= \hat{A}\hat{x}(k)+ \hat{B}U(k), \quad (74)
$$

其中$\hat{x}(k)=[ \tilde{h}(k), \tilde{v}(k),a(k)]^T$, 相应输入$U(k)=[u(k), \dot{v}_p(k -m), \tilde{v}_p(k)]^T$,

$$
\hat{A}=
\begin{bmatrix}
1 & -dt & -dt^2 \
0 & 1 & 0 \
0 & 1 & - dt/\tau
\end{bmatrix},
\quad
\hat{B}=
\begin{bmatrix}
0 & dt^2/2 & dt \
0 & 0 & dt/\tau \
0 & 0 & 0
\end{bmatrix}, \quad (75)
$$

$k$表示第$k$个采样点,$dt$表示采样时间。$m= \eta/dt$是由于与前车之间的无线通信延迟而导致的延迟时间步长数。$\hat{x}(k)$是系统在第$k$次迭代时的状态,$U(k)$表示相应输入,其中$u(k)$是加速度控制指令, $\dot{v}_p(k -m)$, $\tilde{v}_p(k)$被视为可测量的干扰。在与HVA控制相同的控制目标(公式(68)–(71))和固定时间车距范围策略(公式(38))下,输出方程可定义为,

$$
\hat{y}(k)= \hat{E}\hat{x}(k)+ \hat{F}U(k), \quad (76)
$$

其中

$$
\hat{E}=
\begin{bmatrix}
1 & -t_{pth} & 0 \
0 & 0 & 1
\end{bmatrix},
\quad
\hat{F}=
\begin{bmatrix}
0 & 0 & 0 \
0 & -1 & 0 \
0 & 0 & 0
\end{bmatrix}, \quad (77)
$$

以及$\hat{y}(k)$是系统在第$k$个时间步的测量值。然后可以得到代价函数为[28],

$$
G(\hat{y}, u,\Delta u)=
\sum_{i=0}^{p-1} |\Delta \hat{y}(k+i+ 1|k)|^2_{\omega_y} \quad (78)
+ \sum_{i=0}^{p-1} |u(k+i|k)|^2_{\omega_u} + \sum_{i=0}^{p-1} |\Delta u(k+i|k)|^2_{\omega_{\Delta u}} + \rho\xi^2,
$$

其中$\Delta u(k)= u(k) - u(k -1)$,$p$表示算法的预测时域长度,$(k+i|k)$表示在第$k$个时间步长时根据系统状态得到的预测值。 $\xi$被引入作为松弛变量,$\omega_y$、 $\omega_u$、 $\omega_{\Delta u}$为相应的权重系数。因此,该优化问题可表示为,

$$
\min G(\hat{y}, u,\Delta u), \quad (79)
$$

受式(47)中约束的限制。

优化问题 Eq.(79) 可以被表述为一个二次规划(QP),并在每个时间步长通过 Dantzig–Wolfe活动集算法 求解。一旦获得最优解序列$[\Delta u^* (k+i|k)]_{i=1:p}$,仅该序列的第一个元素将被用作加速度指令的增量,实际的控制信号因此计算为:

$$
u(k+ 1)= u(k)+\Delta u^* (k+ 1|k). \quad (80)
$$

在下一次迭代中,控制器将根据更新的信息计算新的指令。

4.4 自适应巡航控制设计

我们关注编队构型中的两辆连续车辆,因为车辆被视为相同的。采用所提出的方法进行控制设计的场景中,前车的速度波动相对于稳定性准则(公式 (60)和(66))较为显著。系统受到正弦输入$v_p(t)= v^ + v_{amp} \sin(\omega t)$的影响,其中$v^ $假设为50公里/小时,且$v_{amp}= 10$公里/小时, $\omega= 1$。初始条件满足在$v^*$处的平衡状态,期望车头时距为$t_{pth}= 2$秒。仿真时间跨度为50秒,采样时间为0.1秒。其他相关参数见表3。

表3 HVA控制参数

参数 参数
$v_{max}$ 100 km/h $\tau$ 0.1 s
$G_{th,lim}$ 2000 $\eta$ 0.2 s
$G_{tv,lim}$ 1500 $t_{pth}$ 2 s
$G_{u,lim}$ 1000 $a_{lim}$ 5 m/s²
$G_{du,lim}$ 20 $h_0$ 10m

SCM混合算法[58]在具有上下界为$[-3,-3,-3]$和$[10, 10, 10]$的增益空间中进行。因此,

$$
Q={k_Q \in \mathbb{R}^3\mid [-3,-3,-3] \le k_Q \le[10, 10, 10] \text{ subject to Eqs.(60) and(66)}}. \quad (81)
$$

单元空间的粗划分计算由$10 \times 10 \times 10$完成,精细化由$3\times 3\times 3$完成。

图14展示了在此情况下获得的帕累托集。帕累托前沿如图15和16所示,表明了多目标优化问题的冲突特性,例如,$G_{th}$的值越小,总会导致$G_{tv}$等越大。

本研究中所有仿真的两辆车的初始速度均设置为$v^*$。图17显示了系统在帕累托集内所有增益下的仿真结果,其中普通增益的响应标记为红色,而三个控制目标分别处于最低水平时的三种极端情况下的增益响应标记为蓝色实线。可以看出,这三个特殊增益几乎确定了所有帕累托最优控制下响应的边界。

4.5 场景仿真

本节通过HVA控制和MPC对不同交通场景进行仿真,以评估所提方法的控制性能。对于MPC的参数,采样时间步长为0.1秒,预测时域和控制时域均为10秒,松弛变量系数 $\rho= 3$和$\text{diag}([0.5, 1, 0])$被视为系数矩阵 $\omega_y$, $\omega_u= 0.5$和$\omega_{\Delta u}= 0.05$[28]。本章中报告的MPC结果是通过使用Matlab中的 MPC工具箱获得的。需要注意的是,MPC中使用的参数可以进行调节,以更关注不同的目标,但根据公式(78),某一特定目标的值降低不可避免地会导致另一目标的增加。结果的比较仅用于说明我们所提出方法达到的性能与 MPC相当,而不是证明其中一种方法完全优于另一种。

稳态跟车 在第一种交通场景中,我们考虑系统输入采用控制设计中的形式,其中$v_p(t)=v^ +v_{amp} \sin(\omega t)$,$v^ = 50$kph,$v_{amp}= 10$kph,$\omega= 1$,且仿真周期为$50$s。在HVA控制的帕累托集中选择两个增益$k_1=[8.4833, 4.5833,-1.0500]$和$k_2=[2.8500,6.3167,-0.6167]$,其对应的帕累托前沿和

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值