自动驾驶中用于跟车控制的变道意图估计
摘要
跟车是高速公路驾驶中最常见的行为。为了实现安全 与协作驾驶,识别来自相邻车道车辆的切入意图至关重要。本文 提出了一种行为估计方法,基于上下文交通信息来识别和预测变 道意图。设计了一个模型预测控制器,通过融合其他车辆的变道 意图来优化加速度序列。对下一代模拟的公开数据集进行了标签 标注,并发布为研究社区的基准测试平台。实验结果表明,提出 的方法能够准确估计车辆行为,从而优于传统跟车控制。
索引术语
协作式跟车,驾驶行为估计,变道预测,模型预测控制。
一、引言
最近,许多研究机构和汽车制造商都将重点放在自动 驾驶系统的商业化上。自动驾驶汽车在道路上的安全性和 可靠性至关重要。大多数交通事故是由人为错误引起的, 其中许多事故发生在变道过程中[1],[2]。此外,少于50% 的驾驶员在变道时使用转向灯[3]。为了确保行车安全, 自动驾驶汽车在周围车辆跨越车道线之前,准确估计其驾 驶行为并预测其变道意图显得尤为重要。
图1展示了高速公路驾驶中的场景。自动驾驶汽车被 标记为主车(蓝色,Veh-h),目标车辆为红色(Veh-t), 前车(Veh-p)位于主车前方,Veh-f t和Veh-rt分别表示目 标车道内的前后车辆。假设红色车辆正在跟随前导车辆并 意图并道。在此情况下,如果主车无法估计红色车辆的汇 入意图,则可能发生加速度的突然变化,导致不舒适甚至 危险的情况。人类驾驶员基于观测值和驾驶经验来预测周 围车辆的行为(是否会汇入本车道)。自动驾驶汽车则使 用计算模型来模拟人类,估计自身及周围车辆的状态。
应估计目标车辆的切入意图,以确保主车的安全和舒适性 跟车。
张一环和王军隶属于中华人民共和国上海市同济大学控制科学与工 程系,邮编201804。林勤和西科·弗尔韦尔隶属于荷兰代尔夫特理工大 学智能系统系,代尔夫特,邮编2628 CD。约翰·M·多兰隶属于美利坚 合众国宾夕法尼亚州匹兹堡市卡内基梅隆大学机器人研究所。
∗通讯作者 junwang@tongji.edu.cn
车辆‐h
车辆‐t
车辆‐p
车辆‐ft 车辆‐rt
车辆‐h
车辆‐t
车辆‐p
车辆‐ft 车属‐rt
变道:
切入
车辆‐h
车辆‐t
车辆‐p
车辆‐ft 车辆‐rt
保持车道:
无切入
利用四个周围车辆的上下文信息来建模目标车辆的驾驶行 为。本文需要将观测值(车辆位置、横向加速度等)识别/ 分类为变道或保持车道。这是一个基于观测值的标准多元 时间序列分类问题,即为完整的变道或保持车道序列分配 一个标签。本研究旨在实现一个更具挑战性的任务,即提 前预测该标签(即意图),以实现控制干预。
尽管自适应巡航控制(ACC)系统自 1995[4],以来 已进入市场,但其在平顺性方面的性能经常受到来自相邻 车道切入车辆的干扰。为了实现更可靠的ACC,应更加关 注其他车辆的意图。本文提出了一种基于意图的跟车控制 方法,通过融合周围车辆的切入意图来实现。
图2展示了所提出方法的框架。首先,使用场景提取 方法获取两类驾驶序列:变道和保持车道。然后,采用结 合高斯混合模型(GMM)的连续隐马尔可夫模型( HMM)分别对变道和保持车道行为进行建模。利用似然 函数以在线方式估计行为。最后,提出了一种模型预测控 制框架来考虑预测的切入意图。
本文的主要贡献如下: 据我们所知,这是首次将交通上下文信息融入驾驶行为的研究
二. 相关工作
相关工作分为两部分:一部分是利用各种信息进行驾 驶行为的估计与预测,另一部分是关于跟车控制,包括数 学模型、控制方法和自适应巡航控制系统。
驾驶行为分类
许多研究聚焦于驾驶行为的分类与预测。在[5],中, 使用隐马尔可夫模型(HMM)和高斯混合模型对跟车和 超车行为进行了建模与识别。在[6],中,提出了一种基于 操作的方法,用于估计驾驶员的驾驶状态,并结合前导车 辆的信息预测其未来轨迹。在跟车场景中,监测相邻车道 的情况对于应对变道行为至关重要。
变道行为估计或意图识别可根据其输入信号分为两类。
第一类使用目标车辆的internal信息,例如油门踏板压力、 制动踏板压力和方向盘角度,来识别驾驶行为。它是一种 主要用于高级驾驶辅助系统。在[7],中,基于车辆加速度、 制动和转向数据,在47个记录的变道场景中实现了93.3% 的准确率。在[8],中,使用横向加速度、方向盘角度和 转向角度,通过连续隐马尔可夫模型对保持车道和变道操 作进行分类,变道的平均识别率超过90%。在[9],中,利 用从车辆状态和驾驶员操作信号中提取的特征识别变道操 作。该数据集由不同驾驶员在不同驾驶条件下记录,识别 率为88.2%。在[10],中,添加了眼动和头部动态等额外 特征以提升行为识别的准确率。在[11],中,利用心电图、 皮肤电反应和呼吸信号训练了一个多层神经网络模型,实 现了在目标车辆实际跨越车道线前约2秒预测变道。
另一类使用目标车辆的外部 信息,例如车速、横向 偏移、距离等。由于所有参数均可通过车载传感器测量, 自动驾驶汽车可以据此估计周围车辆的行为。在[12],中, 横向位置和相对航向角被用作特征来训练支持向量机( SVM),并使用贝叶斯滤波器获得驾驶行为的概率。然 而,周围车辆对目标车辆行为的影响不应被忽略。越来越 多的研究人员在研究驾驶行为时考虑了周围交通情况。在 [13],中,变道意图是基于驾驶员头部动作、内部信号以及 周围车辆的信息进行估计的。该分类器能够更准确地提供 驾驶员的意图。
下一代模拟(NGSIM)数据集已被用于探索警觉变 道过程的特征。在[14],中,使用模糊推理系统根据距离 做出变道决策
和相对速度。在[15],中,应用了一种基于神经网络的学 习方法来建模变道行为。作为经典机器学习方法的基于支 持向量机的分类能够处理高维输入特征。在[16],[17],中, 使用支持向量机对不同的变道行为情况进行分类,并利用 周围车辆的不同输入特征来训练支持向量机。此外,在 [18],[19]中应用了基于贝叶斯网络的概率分类方法。目 标车辆与周围车辆之间的碰撞时间被用作输入特征,以获 得变道行为的概率。在[20]中,利用NGSIM数据提出了 一个变道指数概率模型。多种因素被认为会影响变道决策, 包括目标车辆与原始车道之间的相对速度以及目标车辆与 周围车辆之间的距离。
B. 跟车控制
关于跟车的首项工作可追溯到20世纪50年代。在[21], 中提出了一种线性前车跟随模型,通过使用后随车辆与前 导车辆之间的相对速度来计算期望加速度。另一种广泛使 用的线性模型是赫利模型,于[22]中提出。此外,非线性 的Gazis‐Herman‐Rothery模型引入了距离和速度的幂 运算符[23]。智能驾驶员模型在[24]中被提出,用于模拟 高速公路和城市交通。在我们最近的研究[25],中,设计了 一种类人跟车控制器以模仿人类驾驶行为。这些研究本质 上属于前馈模型,更适合用于模拟跟车行为而非实时控制。
自适应巡航控制系统作为定速巡航的升级,提高了驾 驶的便利性和安全性。多种控制方法已应用于自适应巡航 控制系统,例如比例‐积分(PI)控制 [26],模糊控制 [27], 和模型预测控制(MPC) [28],[29]。模型预测控制方法可 用于处理驾驶安全、燃油效率和乘坐舒适性等多目标优化 问题。在[30],中提出了一种场景MPC方法,可在多车道 和多车场景中实现预测性和预判性驾驶。通过使用随机建 模方法,确定了周围交通参与者的变道概率,并将其集成 到优化中。仿真结果表明,相较于PI控制,其对速度和加 速度的控制更加平滑。在[31],中,基于高速公路自然驾 驶数据生成了跟车间距模型,并将切入概率纳入MPC控 制算法中。模拟场景展示了车辆行驶的平顺性。尽管这些 方法考虑了相邻车道车辆的行为,但意图估计的方法仅通 过模拟数据进行了测试,而非真实交通数据。本研究中, 驾驶行为模型是从真实数据中学习得到的,所有测试均在 真实驾驶场景中进行。
总之,相邻车道的切入车辆往往会中断自适应巡航控 制系统的平稳可靠性能。行为估计模型至关重要 以提升自适应巡航控制系统的性能。本文重点研究从周围 车辆的外部信息中“随时”(即在线方式)预测切入意图。
所推断的切入概率被整合到模型预测控制框架中,以有效 应对接近目标车辆的突发行为变化。
III. 提出的方法
在NGSIM数据集中,提取了每辆车辆的独立场景, 其中周围车辆保持不变。使用高斯混合模型‐隐马尔可夫 模型学习两种类型的行为模型,即保持车道和变道。在测 试阶段,通过前向算法计算序列的似然,并与阈值进行比 较以实现最终识别。计算变道概率并将其集成到模型预测 控制框架中,以控制主车的跟车行为。
A. 场景定义与提取
下文将详细描述NGSIM数据集,并定义本文所使用的场景。
1) 数据描述:
本文使用了由美国联邦公路管理局资 助的NGSIM [32], a项目的单车轨迹公开数据集。这些轨 迹数据在交通研究历史上迄今是独一无二的,为结构化道 路上的驾驶行为研究提供了宝贵的依据。所有实验均基于 I‐80和US‐101的数据集进行。两个场景的道路结构如图3 所示。标注的场景数据已开源。1
(a) I‐80 场景 (b) US‐101 场景
I‐80数据集包含三个15分钟时段:下午4:00至4:15、下午 5:00至5:15和下午5:15至5:30。这些时段分别代表拥堵的形成阶 段, 非拥堵与拥堵状态之间的过渡以及完全拥堵状态。 US‐101数据集共提供45分钟的数据,被划分为三个15分 钟时段:上午7:50至8:05、上午8:05至8:20和上午8:20至 8:35。两个数据集中的车辆轨迹均包含研究区域内每辆车 辆的精确位置,且数据以10赫兹的频率进行采样。
2) 场景分割:
图1中分割的场景具有以下属性:
-
在每种场景中,目标车辆(Veh-h、Veh-p、Veh-f t、Veh-rt) 的周围车辆(Veh-t)保持不变。
我们将缺失的周围车辆的相对距离设为150米,相对速度设为0。
当目标车辆跨越车道线(并道)、超过Veh-p或让行于Veh-h时, 该场景结束。 - 一旦前一场景结束,新的场景立即重新开始,以确保 驾驶场景之间的连续性。
- 分割后的场景至少持续两秒钟,以确保完整的变道或车 道保持行为。
| 数据集 | 变道 | 车道保持 |
|---|---|---|
| I‐80‐1 | 212(平均持续时间 6.12 秒) | 16997(平均持续时间 6.01 秒) |
| I‐80‐2 | 159(平均持续时间 6.13 秒) | 16972(平均持续时间 6.16 秒) |
| I‐80‐3 | 167(平均持续时间 6.30 秒) | 15683(平均持续时间 6.26 秒) |
| US‐101‐1 | 242(平均持续时间 8.07 秒) | 15683(平均持续时间 7.99 秒) |
| US‐101‐2 | 156(平均持续时间 8.56 秒) | 17254(平均持续时间 8.07 秒) |
| US‐101‐3 | 154(平均持续时间 7.44 秒) | 17796(平均持续时间 7.71 秒) |
两个数据集中分割序列的汇总如表I所示。每个场景 分割的平均持续时间约为6到8秒。数据高度不平衡,即保 持车道的比例远高于变道,这给行为识别带来了另一项重 大挑战。然而,该数据比例与日常驾驶情况一致。根据参 考文献[14],[15],,表II中列出的特征被认为具有相关性并 被提取。
| 符号 | 描述 |
|---|---|
| vx | 车辆‐t的纵向速度 |
| do | 车辆‐t的横向速度 |
| do | 从目标车道线到Veh-t的横向偏移 |
| ∆vt,p | Veh-t与Veh-p之间的纵向速度差 |
| ∆v t,h | Veh-t与Veh-h之间的纵向速度差 |
| ∆vt,ft | Veh-t与Veh-f t之间的纵向速度差 |
| ∆vt,rt | Veh-t与Veh-rt之间的纵向速度差 |
| ∆x t,p | Veh-t与Veh-p之间的纵向距离 |
| ∆x t,h | Veh-t与Veh-h之间的纵向距离 |
| ∆x t,ft | 车辆-t 与车辆-f t之间的纵向距离 |
| ∆x t,rt | 车辆‐t 和 车辆‐rt 之间的纵向距离 |
B. 行为模型
隐马尔可夫模型由于其在描述动态过程和推断未观测 (隐藏)状态方面的强大能力,已被广泛用于建模驾驶行 为。高斯混合模型(GMMs)用于建模速度等连续观测值 的概率。
1) 高斯混合模型(GMM):
表II中的变量可分为以下 三类:
ξt=[[vx(t), vy(t), do(t)], [∆vt,p(t),∆vt,h(t),∆xt,p(t),∆xt,h(t)], [∆vt,ft(t),∆vt,rt(t),∆xt,ft(t),∆xt,rt(t)]] T
注意, ξt用于对本文中的行为进行建模,第一组[vx(t) vy(t) do(t)]T用于构建仅考虑目标车辆信息的模型。在本文 中,我们假设观测值 ξ的分布是多元高斯分布函数的加权 和:
p(ξt; θ)= ∑ K k=1 ωkN(ξt; µk,Σk) = ∑ K k=1 ωk · exp(−1 2(ξt − µk) TΣ−1 k(ξt − µk)) √(2π)11 det(Σk) (1)
其中 θ={θk} K k=1={ωk, µk,Σk} K k=1是高斯混合模型( GMMs)的参数, N(ξt; µk,Σk) 是均值中心为 µk ∈ R 11×1、 协方差矩阵为 Σk ∈ R 11×11的多元高斯分布, K是高斯混合 模型分量的数量,可通过贝叶斯信息准则(BIC)[34]确定。 由于 ωk ∈(0, 1]是第 kth个高斯分量的权重),我们有 ∑ K k=1 ωk= 1。
给定一个数据序列 ξ1:n,使用最大似然估计方法来寻 找一个 θ,使其最大化GMM函数的似然:
L(θ)= ∑ n t=1 ln(p(ξt; θ)) (2)
本文利用期望最大化算法来搜索最优参数 θ∗= arg max θ L(θ)
在步骤 j对 θ的估计表示为ˆθj。从ˆθj到ˆθj+1的迭代 通过以下E步和M-步[35]实现。
- E步:在每次迭代中,使用先前的估计值ˆθj计算每个分 量 k的后验概率:
Pj +1 k(ξt) = ωˆj k · N(ξt ; µˆj k , Σˆj k) ∑ K l=1 ωˆ j l · N(ξt ; µˆ j l , Σˆ j l) (3)
- M步:然后通过更新模型参数
ωˆ j +1 k = 1 n ∑ n t=1 P j +1 k(ξt)
µˆ j +1 k = ∑ n t=1(ξt · P j +1 k(ξt)) ∑ n t=1 P j +1 k(ξt)
Σˆ j +1 k = ∑ n t=1(P j +1 k(ξt)( ξ t − µˆ j +1 k)(ξt − µˆ j +1 k) T) ∑ n t=1 P j +1 k (ξt)
每次迭代结束时,通过对数似然 L(ˆθj+1)进行计算
L(θˆj+1)= ∑ n t=1 L(θˆj) (4)
迭代将继续,直到两个连续估计模型之间的似然差异 小于一个阈值,本文中该阈值设置为 10−10。
2) HMM:
建立两个独立的隐马尔可夫模型来表示变 道和保持车道的行为。本文中,隐马尔可夫模型的结构为 从左到右,如图2所示。该隐马尔可夫模型由 λ={S, Z, A, B, π}
其中
- S={s1, · · ·, sN} 表示一组有限的 N 隐藏状态。
- Z={ξt}是在时间 t观测到的所有状态 ξ的集合, 每个 ξ包含高斯混合模型(GMM)中的十一个元素。
- A=[aij]是状态转移矩阵, aij被定义为从状态 si转移到 状态 sj的概率。
- B={bi(ξ)}是观测模型, bi(ξ)表示在状态si下观察 到 ξ的概率。
- π={πi}是初始状态分布,其中 πi表示状态 si 作为初始状态的概率。
读者可参考[36]以获取HMM更详细的公式化描述及 其应用。HMM是一种双重随机模型:一种是用于随机状 态转移的马尔可夫模型,另一种是每个状态中的随机观测。 选择三个隐状态来表示变道和车道保持行为背后的动态过 程。连续观测模型 B定义为
bi(ξ)= ∑ K k=1 ωkN(ξ; µk,Σk) (5)
Baum‐Welch算法[37]用于估计 λ两个隐马尔可 夫模型的参数。它是一种用于最大化观测值似然的近似迭 代优化技术。通过选择一组随机的初始参数,并利用梯度 更新进行优化改进。
3) 行为识别:
在测试阶段,以滚动时域方式实现二分 类识别,即变道或保持车道。假设序列 ξ 1:n是一个完整的 变道/保持车道周期,其中 n是序列长度。长度为s的最 短序列意味着区分两种行为所需的最少信息。如果 s< n, 则可以做出预测。流式数据 ξ 1:t ,其中 t ≥ s ,分别作 为实时输入馈送到 λlk和 λlc进行似然计算。 λlk和 λlc 分别表示保持车道和变道的隐马尔可夫模型(HMM)。
P(ξ1:t |λi) 通过前向算法[36]获得:
P(ξ1:t |λi) = ∑ N i=1 α t( i) (6)
where
αt+1(j)=( ∑ N i=1 αt(i) · aij) bj(ξt+1) α1(j)= πj bj(ξ1) (7)
由于没有关于特定驾驶员驾驶行为的先验知识,我们 假设各模型的先验概率相同。在计算 P(ξ1:t|λlk) 和 P( ξ1:t|λlc) 后,我们可以设置一个阈值来估计目标车辆的当 前行为:
R= P(ξ1:t|λlc) P(ξ1:t|λlk) (8)
其中 R表示分类更倾向于变道还是保持。
C. 模型预测控制
行为模型构建完成后,计算变道概率并将其集成到模 型预测控制框架中。
1) 意图估计:
变道意图概率按如下方式计算:
Pc= { tanh(ωc · R −RT Rm −RT) , R> RT 0, R ≤ RT (9)
其中 RT是分类阈值, Rm是从训练数据中获得的最大 比值, ωc是表示比值范围的跨度参数。因此,似然被归 一化为0到1之间的概率。选择“tanh”函数是因为训练 数据集中随机变量 R−RT Rm−RT 的值服从该分布时拟合误差最 小。
2) 预测模型:
本文中,车辆的纵向运动通过
x(t+1)= x(t)+ v(t)∆t+0.5a(t)∆t2 v(t+1)= v(t)+ a(t)∆t (10) 其中 x, v, a分别为主车的位置、速度和加速度, ∆t 为采样时间。然后定义以下变量:
- 距离: ∆x= xf − xh其中xf为虚拟领航车的纵向位 置,且xf= Pcxt+(1 − Pc)xp。注意,如果概率 Pc为 1,则主车将假设目标车辆为前导车辆。
- 相对速度: ∆v= vf−vh其中vf为虚拟领航车的纵向 速度,且vf= Pcvt+(1−Pc)vp。
- 加速度:ah= jh∆t其中jh为主车的加加速度。
由于车辆运动的不确定性,我们假设周围车辆的加速 度在预测步骤中与参考文献[31]中的加速度保持一致。这 一假设是合理的,因为当更新前导车辆的实际状态时,模 型预测控制的预测窗口会持续后退到下一个时间点。
3) 滚动时域优化:
模型预测控制的代价函数设计用于满 足以下目标:
- 跟踪误差:跟车控制的目标是在保持安全距离的同时 跟随前导车辆的速度。该距离定义为固定时间间隔策略 [30]:
ddes= d0+ τh1vh+ τh2∆v
其中 d0表示静止状态下的期望距离, τh1、τh2为固定 时间车头间距参数。
JT= ωd(ddes −∆x)2+ ωv∆v2 (11)
- 舒适性与平顺性:主车应通过最小化其加速度和加加 速度来实现舒适且节能的驾驶模式。
JC= ωaa 2 h+ ωjj 2 h (12)
其中 ωd、 ωv、 ωa和 ωu是代价函数的权重值。
考虑到车辆的非完整约束和跟车场景,MPC设计中 还应考虑以下约束:
- 主车的速度受限于 0 ≤ vh ≤ vmax
- 与前导车辆的最小间距受以下约束: dsafe ≤∆x 其中 dsafe= τ0vh 是最小时间车头间距。
- 主车的加速度约束为 amin ≤ ah ≤ amax
- 主车的加加速度约束为 jmin ≤ jh ≤ jmax
优化问题现在可以写成:
min jh( k),k=1,···,N p J= JT+ JC (13)
其中 Np为预测步骤。该优化问题受上述约束条件限制。 注意,最优解是一个长度为 Np的控制值向量。模型预测 控制方法仅取第一个值,然后移动到下一个时间点并重新 开始优化。
四、实验结果
通过5折交叉验证实验验证了提出的方法的有效性。为 了平衡变道和保持车道的数据比例,随机选择了相同数量 的数据,即538个序列。首先,计算BIC值以确定GMM分 量的数量,其中 n t 是训练数据的长度ˆ, L是最大对数似 然。在拟合高斯混合模型(GMMs)时,通过增加 K可以 提高似然,但这可能导致过拟合。此外,对数似然可能具 有较大的负值,并且该方程中的这两部分 可能不在同一数量级上。设置归一化步骤以在参数数量和 对数似然之间进行权衡:
̂ BIC= ln(nt) · K − Kmin Kmax − Kmin − 2 · ln(Lˆ)− ln(Lˆ)min ln(Lˆ)max − ln(Lˆ)min
在此步骤中,使用每个数据集中的所有序列来计算 BIC值,其中 K从1变化到20。对于类似肘部的参数选择 [38],通常存在一个合理的范围。最终参数 K根据最小 归一化BIC值确定。然后,在I‐80数据集中, K= 3被 选用于变道和保持车道;在US‐101数据集中, K= 4被 选用于变道, K= 3被选用于保持车道。
A. 分类评估
为了突出周围车辆的影响,以下实验还研究了仅考虑 目标车辆信息的模型,该模型被标记为“tgt”,表示仅 考虑target vehicle。所提出的方法被标记为“srd”,表 示考虑surrounding vehicles。
受试者工作特征曲线是一种标准分析工具,用于评估 具有可变阈值(即本文中的 RT)的二分类分类器系统的 性能。曲线下面积(AUC)等于分类器将随机选择的正例 排在负例之前的概率(假设正例的排序高于负例)[39]。 在本文中,AUC表示行为估计的分类性能。当AUC(取 值范围为0到1)越大时,行为估计的准确率越高。如表 III所示,“srd”方法的AUC高于“tgt”方法,即考虑 周围车辆的行为估计分类结果比仅考虑目标车辆信息的结 果更准确。
| 案例 | I | II | III | IV | V |
|---|---|---|---|---|---|
| srd‐I‐80 | 0.9603 | 0.9475 | 0.9418 | 0.9575 | 0.9356 |
| tgt‐I‐80 | 0.9282 | 0.9064 | 0.9325 | 0.9046 | 0.9182 |
| srd‐US‐101 | 0.9173 | 0.9295 | 0.9270 | 0.9358 | 0.9163 |
| tgt‐US‐101 | 0.9065 | 0.9167 | 0.9058 | 0.8980 | 0.9007 |
除了AUC评估外,还引入了以下定量指标以进行全面评 估:
- 真正例率(TPR),也称为召回率,是指在所有真实 事件中被正确分类的事件所占的分数,即 TPR= TP TP+ FN 其中,TP 表示真阳性,FN 表示假阴性(漏检)。
- 假阳性率(FPR)是指在所有假事件中被错误分类的事 件所占的分数,即 FPR= FP FP+ TN 其中,FP 表示假阳性(误报),TN 表示真阴性。
| 数据集 | 案例 | I | II | III | IV | V | 平均 |
|---|---|---|---|---|---|---|---|
| I-80 | TPR srd | 0.9158 | 0.8055 | 0.8056 | 0.8425 | 0.8037 | 0.8346 |
| TPR tgt | 0.7757 | 0.7407 | 0.8241 | 0.5278 | 0.6168 | 0.6971 | |
| FPR srd | 0.0654 | 0.0648 | 0.0740 | 0.0740 | 0.0654 | 0.0688 | |
| FPR tgt | 0.0841 | 0.0741 | 0.0648 | 0.0648 | 0.0654 | 0.0706 | |
| ACC srd | 0.9252 | 0.8703 | 0.8657 | 0.8842 | 0.8691 | 0.8829 | |
| ACC tgt | 0.8458 | 0.8333 | 0.8796 | 0.7315 | 0.7757 | 0.8132 | |
| PRE srd | 0.9333 | 0.9255 | 0.9157 | 0.9191 | 0.9247 | 0.9237 | |
| PRE tgt | 0.9022 | 0.9091 | 0.9271 | 0.8906 | 0.9041 | 0.9066 | |
| F1 srd | 0.9245 | 0.8614 | 0.8571 | 0.8792 | 0.8600 | 0.8765 | |
| F1 tgt | 0.8342 | 0.8163 | 0.8725 | 0.6627 | 0.7333 | 0.7838 | |
| US‐101 | TPR srd | 0.8091 | 0.7478 | 0.8108 | 0.8091 | 0.7727 | 0.7898 |
| TPR tgt | 0.6546 | 0.8378 | 0.8738 | 0.5909 | 0.7636 | 0.7441 | |
| FPR srd | 0.0636 | 0.0811 | 0.0811 | 0.0909 | 0.0727 | 0.0778 | |
| FPR tgt | 0.0909 | 0.0991 | 0.0901 | 0.1000 | 0.0909 | 0.0942 | |
| ACC srd | 0.8727 | 0.8333 | 0.8648 | 0.8591 | 0.8501 | 0.8561 | |
| ACC tgt | 0.7818 | 0.8694 | 0.8919 | 0.7455 | 0.8364 | 0.8249 | |
| PRE srd | 0.9271 | 0.9022 | 0.9091 | 0.8989 | 0.9139 | 0.9103 | |
| PRE tgt | 0.8781 | 0.8942 | 0.9066 | 0.8553 | 0.8936 | 0.8855 | |
| F1 srd | 0.8641 | 0.8177 | 0.8571 | 0.8516 | 0.8374 | 0.8456 | |
| F1 tgt | 0.7501 | 0.8651 | 0.8899 | 0.6989 | 0.8235 | 0.8055 |
阈值是通过在训练数据中选择假阳性率=5%来确定 的。然后,这些阈值被用于测试集中的最终评估(见表 IV中报告的结果)。评估结果表明,考虑周围车辆信息的 提出的方法比仅考虑目标车辆的方法具有更好的性能。
B. 变道预测
另一个挑战是在目标车辆跨越车道线之前预测其变道 行为。本文中,预测时间定义为 τt= te − tp 其中 te表示场景的结束时间, tp是首次达到变道标签的 时刻。在测试数据集中, te是目标车辆跨越车道线的时 间, tp是变道行为被估计的时间。当比率 R超过阈值时, 最终驾驶行为被估计为变道。此外,如果最终输出行为直 到场景结束仍保持为变道,则预测时间为 t p与 te之间的 时段。
| 案例 | I | II | III | IV | V | 平均 |
|---|---|---|---|---|---|---|
| srd‐I‐80 | 5.16 | 5.21 | 4.97 | 3.11 | 3.49 | 4.39 |
| tgt‐I‐80 | 4.12 | 3.42 | 2.99 | 2.58 | 2.49 | 3.12 |
| srd‐US‐101 | 4.67 | 4.96 | 5.38 | 4.24 | 4.43 | 4.73 |
| tgt‐US‐101 | 2.67 | 2.81 | 3.12 | 2.23 | 2.41 | 2.65 |
表五比较了“srd”和“tgt”的平均预测时间,表明提 出的方法是有效的 更早地预测目标车辆的意图。此外,还进行了使用支持向 量机(SVM)[12]进行变道预测的对比。采用高斯混合 模型‐隐马尔可夫模型(GMM‐HMM)的提出的方法结果 更优,因为驾驶行为是时间序列,且先前的状态与当前及 未来的状态相关。支持向量机(SVM)是一种只能输入 固定维度变量的分类器,因此无法对时间序列效应进行建 模。对比结果如图4和图5所示。提出的方法在提前0.5秒 预测变道行为时,真正例率约为80%,并在变道发生前4 秒时仍保持60%的真正例率。此外,提出的方法还具有最 低的假正例率,而支持向量机(SVM)方法的假正例率 则超过20%。
对时间序列序列进行建模时,支持向量机不稳定,并且在没 有滤波的情况下无法进行任何估计或预测。
C. 跟车测试结果
从NGSIM数据集中提取包含主车和目标车辆的场景 用于跟车控制测试。周围车辆的信息被用作主车的观测信 息。模型预测控制的参数列于表VI。
| 变量 | 值 | 单位 |
|---|---|---|
| ∆t | 0.1 | s |
| Np | 20 | − |
| ωc | 10 | − |
| d0 | 6 | m |
| vmax | 30 | m/s |
| τ0, τh1, τh2 | 0.5, 1, 3 | s |
| ωd, ωv, ωa, ω j | 0.01,0.02,0.01,0.05 | − |
| amin, amax | −4, 6 | m/s² |
| jmin, jmax | −0.3, 0.3 | m/s³ |
如表VII所示,选择了五项指标来评估提出的方法, 并比较了三种方法以说明切入情况的影响。“srd‐MPC” 表示所提出的方法,即通过考虑所有周围车辆的信息来估 计目标车辆的意图。“tgt‐MPC”表示仅使用目标车辆信 息估计意图的模型预测控制控制器。“Only‐MPC”是不 考虑目标车辆切入意图的纯模型预测控制方法。表VII中 列出的速度、加速度和加加速度为每次测试中的平均值。
危险指数定义为 HI= exp(−(∆x/h 1) h 2) 表示追尾碰撞的程度[40]。 h 1 和 h 2 的值是通过[31]中 的高速公路自然驾驶数据拟合得到的。碰撞率(CR)表示 在主车的仿真中,碰撞次数的结果表明,提出的方法的平 均速度接近传统MPC。通过目标车辆的意图估计,前车 突然变化的影响得到了平滑。同时,提出的方法的危险指 数和碰撞率远低于其他方法。需要注意的是,切入车辆的 轨迹作为真实随机输入(尽管在数据集中是固定的),用 于实验性地验证所提出方法的避碰控制效果。主车与切入 车辆之间的在线交互被省略,这是一个基本假设。
| 数据集 | 案例 | I | II | III | IV | V | 平均 |
|---|---|---|---|---|---|---|---|
| I-80 | vh (米/秒) srd‐MPC | 6.3667 | 7.5950 | 6.2163 | 6.0926 | 6.1791 | 6.4899 |
| vh (米/秒) tgt‐MPC | 6.3292 | 7.5994 | 6.1411 | 5.8433 | 5.9667 | 6.3759 | |
| vh (米/秒) 仅MPC | 6.9295 | 7.5845 | 6.2827 | 6.0988 | 6.2823 | 6.6356 | |
| ah (米/秒²) srd‐MPC | 1.1624 | 1.0795 | 1.1589 | 1.1845 | 1.2646 | 1.1700 | |
| ah (米/秒²) tgt‐MPC | 1.1974 | 1.5522 | 1.3786 | 1.2096 | 1.4739 | 1.3623 | |
| ah (米/秒²) 仅MPC | 1.4067 | 1.5785 | 1.4746 | 1.3482 | 1.4555 | 1.4527 | |
| ∆ah (米/秒³) srd‐MPC | 0.1253 | 0.1399 | 0.1378 | 0.1409 | 0.1548 | 0.1397 | |
| ∆ah (米/秒³) tgt‐MPC | 0.1263 | 0.1836 | 0.1569 | 0.1498 | 0.1783 | 0.1590 | |
| ∆ah (米/秒³) 仅MPC | 0.1625 | 0.1892 | 0.1732 | 0.1606 | 0.1734 | 0.1718 | |
| HI srd‐MPC | 0.0310 | 0.0214 | 0.2641 | 0.3888 | 0.4185 | 0.2248 | |
| HI tgt‐MPC | 0.1245 | 0.4692 | 0.2650 | 0.4297 | 0.8305 | 0.4238 | |
| HI 仅MPC | 0.6393 | 0.4705 | 0.2821 | 0.6097 | 0.9959 | 0.5995 | |
| CR srd‐MPC | 0/29 | 0/22 | 1/25 | 2/25 | 2/21 | 0.0430 | |
| CR tgt‐MPC | 1/29 | 3/22 | 1/25 | 3/25 | 3/21 | 0.0947 | |
| CR 仅MPC | 4/29 | 3/22 | 1/25 | 4/25 | 4/21 | 0.1330 | |
| US‐101 | vh (米/秒) srd‐MPC | 10.1505 | 10.4960 | 10.2020 | 10.9406 | 9.7350 | 10.3048 |
| vh (米/秒) tgt‐MPC | 10.3989 | 10.7071 | 10.5165 | 11.0393 | 9.8605 | 10.5045 | |
| vh (米/秒) 仅MPC | 10.6237 | 10.9072 | 10.6093 | 11.2079 | 9.8176 | 10.6331 | |
| ah (米/秒²) srd‐MPC | 1.1609 | 1.3325 | 1.0661 | 1.7717 | 1.4109 | 1.3484 | |
| ah (米/秒²) tgt‐MPC | 1.1632 | 1.6061 | 1.4135 | 1.8874 | 1.4795 | 1.5099 | |
| ah (米/秒²) 仅MPC | 1.4798 | 1.6183 | 1.4058 | 1.9159 | 1.7556 | 1.6351 | |
| ∆ah (米/秒³) srd‐MPC | 0.1245 | 0.1526 | 0.1145 | 0.1787 | 0.1550 | 0.1451 | |
| ∆ah (米/秒³) tgt‐MPC | 0.1320 | 0.1710 | 0.1511 | 0.1841 | 0.1619 | 0.1600 | |
| ∆ah (米/秒³) 仅MPC | 0.1698 | 0.1730 | 0.1515 | 0.1827 | 0.1850 | 0.1724 | |
| HI srd‐MPC | 0.2664 | 0.3675 | 0.1517 | 1.0301 | 0.4928 | 0.4617 | |
| HI tgt‐MPC | 0.2865 | 0.8062 | 0.7836 | 1.2306 | 0.7578 | 0.7729 | |
| HI 仅MPC | 0.6062 | 0.8269 | 1.1758 | 1.3458 | 1.0394 | 0.9988 | |
| CR srd‐MPC | 2/35 | 2/28 | 1/40 | 6/31 | 2/36 | 0.0805 | |
| CR tgt‐MPC | 2/35 | 6/28 | 5/40 | 8/31 | 4/36 | 0.1531 | |
| CR 仅MPC | 4/35 | 6/28 | 8/40 | 8/31 | 6/36 | 0.1907 |
从测试数据中选取了两个详细示例,以说明提出的方 法在图7和图8中的优势,其中真实数据来自数据集中的驾 驶员操作。第一个示例是I‐80数据集中的一个切入场景, 如图7所示。在此场景中,当目标车辆速度较慢并希望让 行后方更快的跟随车辆时,发生了切入行为。如图7(d)所 示,提出的方法在1.8 s时检测到目标车辆的变道意图,而 目标车辆在7.3 s时跨越车道线,此时相对距离的突变如图 7(b)所示。若仅使用目标车辆信息,则变道意图直到6.6 s才被检测到。通过使用提出的方法,主车能够在切入发 生前更早地实施减速干预控制,从而获得平滑加速度,并 避免紧急制动。
另一个来自US‐101数据集的示例如图8所示。在此场 景中,目标车辆试图并入主车车道以加速。提出的方法在 1.1秒时估计出切入行为,而目标车辆在8.2秒时跨越车道 线。与上一个场景类似,在加加速度子图中可以看到更早 且更平滑的控制。如果没有意图估计,由纯模型预测控制 控制的主车由于突然切入而未能避免碰撞。
五、结论
本文提出了一种结合其他交通参与者变道行为估计的 跟车控制方法。利用目标车辆及其周围车辆的多变量时间 序列数据,构建了两个连续隐马尔可夫模型(HMM), 分别表示变道行为和保持车道行为。采用基于阈值的分类 方法对目标车辆的行为进行估计。同时,基于行为估计结 果计算切入概率,并应用模型预测控制方法优化主车的跟 车行为。该目标车辆行为模型的真正例率可达85%以上, 且能在目标车辆跨越车道线前约4秒预测其变道行为。所 提出的基于意图的模型预测控制在安全性和乘坐舒适性方 面表现出更优的性能。
未来,我们将在更复杂的场景(如交叉路口)中研究 基于意图预测的策略。复杂模型的解释也是一个研究方向。 类似时间自动机的洞察模型将作为一种有前景的替代方案。
3万+

被折叠的 条评论
为什么被折叠?



