基于意图估计的自动驾驶跟车控制

部署运行你感兴趣的模型镜像

自动驾驶中用于跟车控制的变道意图估计

摘要

跟车是高速公路驾驶中最常见的行为。为了实现安全 与协作驾驶,识别来自相邻车道车辆的切入意图至关重要。本文 提出了一种行为估计方法,基于上下文交通信息来识别和预测变 道意图。设计了一个模型预测控制器,通过融合其他车辆的变道 意图来优化加速度序列。对下一代模拟的公开数据集进行了标签 标注,并发布为研究社区的基准测试平台。实验结果表明,提出 的方法能够准确估计车辆行为,从而优于传统跟车控制。

索引术语

协作式跟车,驾驶行为估计,变道预测,模型预测控制。

一、引言

最近,许多研究机构和汽车制造商都将重点放在自动 驾驶系统的商业化上。自动驾驶汽车在道路上的安全性和 可靠性至关重要。大多数交通事故是由人为错误引起的, 其中许多事故发生在变道过程中[1],[2]。此外,少于50% 的驾驶员在变道时使用转向灯[3]。为了确保行车安全, 自动驾驶汽车在周围车辆跨越车道线之前,准确估计其驾 驶行为并预测其变道意图显得尤为重要。

示意图0

图1展示了高速公路驾驶中的场景。自动驾驶汽车被 标记为主车(蓝色,Veh-h),目标车辆为红色(Veh-t), 前车(Veh-p)位于主车前方,Veh-f t和Veh-rt分别表示目 标车道内的前后车辆。假设红色车辆正在跟随前导车辆并 意图并道。在此情况下,如果主车无法估计红色车辆的汇 入意图,则可能发生加速度的突然变化,导致不舒适甚至 危险的情况。人类驾驶员基于观测值和驾驶经验来预测周 围车辆的行为(是否会汇入本车道)。自动驾驶汽车则使 用计算模型来模拟人类,估计自身及周围车辆的状态。

应估计目标车辆的切入意图,以确保主车的安全和舒适性 跟车。

张一环和王军隶属于中华人民共和国上海市同济大学控制科学与工 程系,邮编201804。林勤和西科·弗尔韦尔隶属于荷兰代尔夫特理工大 学智能系统系,代尔夫特,邮编2628 CD。约翰·M·多兰隶属于美利坚 合众国宾夕法尼亚州匹兹堡市卡内基梅隆大学机器人研究所。

∗通讯作者 junwang@tongji.edu.cn

车辆‐h
车辆‐t
车辆‐p
车辆‐ft 车辆‐rt
车辆‐h
车辆‐t
车辆‐p
车辆‐ft 车属‐rt
变道:
切入
车辆‐h
车辆‐t
车辆‐p
车辆‐ft 车辆‐rt
保持车道:
无切入

利用四个周围车辆的上下文信息来建模目标车辆的驾驶行 为。本文需要将观测值(车辆位置、横向加速度等)识别/ 分类为变道或保持车道。这是一个基于观测值的标准多元 时间序列分类问题,即为完整的变道或保持车道序列分配 一个标签。本研究旨在实现一个更具挑战性的任务,即提 前预测该标签(即意图),以实现控制干预。

尽管自适应巡航控制(ACC)系统自 1995[4],以来 已进入市场,但其在平顺性方面的性能经常受到来自相邻 车道切入车辆的干扰。为了实现更可靠的ACC,应更加关 注其他车辆的意图。本文提出了一种基于意图的跟车控制 方法,通过融合周围车辆的切入意图来实现。

示意图1

图2展示了所提出方法的框架。首先,使用场景提取 方法获取两类驾驶序列:变道和保持车道。然后,采用结 合高斯混合模型(GMM)的连续隐马尔可夫模型( HMM)分别对变道和保持车道行为进行建模。利用似然 函数以在线方式估计行为。最后,提出了一种模型预测控 制框架来考虑预测的切入意图。

本文的主要贡献如下: 据我们所知,这是首次将交通上下文信息融入驾驶行为的研究

二. 相关工作

相关工作分为两部分:一部分是利用各种信息进行驾 驶行为的估计与预测,另一部分是关于跟车控制,包括数 学模型、控制方法和自适应巡航控制系统。

驾驶行为分类

许多研究聚焦于驾驶行为的分类与预测。在[5],中, 使用隐马尔可夫模型(HMM)和高斯混合模型对跟车和 超车行为进行了建模与识别。在[6],中,提出了一种基于 操作的方法,用于估计驾驶员的驾驶状态,并结合前导车 辆的信息预测其未来轨迹。在跟车场景中,监测相邻车道 的情况对于应对变道行为至关重要。

变道行为估计或意图识别可根据其输入信号分为两类。

第一类使用目标车辆的internal信息,例如油门踏板压力、 制动踏板压力和方向盘角度,来识别驾驶行为。它是一种 主要用于高级驾驶辅助系统。在[7],中,基于车辆加速度、 制动和转向数据,在47个记录的变道场景中实现了93.3% 的准确率。在[8],中,使用横向加速度、方向盘角度和 转向角度,通过连续隐马尔可夫模型对保持车道和变道操 作进行分类,变道的平均识别率超过90%。在[9],中,利 用从车辆状态和驾驶员操作信号中提取的特征识别变道操 作。该数据集由不同驾驶员在不同驾驶条件下记录,识别 率为88.2%。在[10],中,添加了眼动和头部动态等额外 特征以提升行为识别的准确率。在[11],中,利用心电图、 皮肤电反应和呼吸信号训练了一个多层神经网络模型,实 现了在目标车辆实际跨越车道线前约2秒预测变道。

另一类使用目标车辆的外部 信息,例如车速、横向 偏移、距离等。由于所有参数均可通过车载传感器测量, 自动驾驶汽车可以据此估计周围车辆的行为。在[12],中, 横向位置和相对航向角被用作特征来训练支持向量机( SVM),并使用贝叶斯滤波器获得驾驶行为的概率。然 而,周围车辆对目标车辆行为的影响不应被忽略。越来越 多的研究人员在研究驾驶行为时考虑了周围交通情况。在 [13],中,变道意图是基于驾驶员头部动作、内部信号以及 周围车辆的信息进行估计的。该分类器能够更准确地提供 驾驶员的意图。

下一代模拟(NGSIM)数据集已被用于探索警觉变 道过程的特征。在[14],中,使用模糊推理系统根据距离 做出变道决策

和相对速度。在[15],中,应用了一种基于神经网络的学 习方法来建模变道行为。作为经典机器学习方法的基于支 持向量机的分类能够处理高维输入特征。在[16],[17],中, 使用支持向量机对不同的变道行为情况进行分类,并利用 周围车辆的不同输入特征来训练支持向量机。此外,在 [18],[19]中应用了基于贝叶斯网络的概率分类方法。目 标车辆与周围车辆之间的碰撞时间被用作输入特征,以获 得变道行为的概率。在[20]中,利用NGSIM数据提出了 一个变道指数概率模型。多种因素被认为会影响变道决策, 包括目标车辆与原始车道之间的相对速度以及目标车辆与 周围车辆之间的距离。

B. 跟车控制

关于跟车的首项工作可追溯到20世纪50年代。在[21], 中提出了一种线性前车跟随模型,通过使用后随车辆与前 导车辆之间的相对速度来计算期望加速度。另一种广泛使 用的线性模型是赫利模型,于[22]中提出。此外,非线性 的Gazis‐Herman‐Rothery模型引入了距离和速度的幂 运算符[23]。智能驾驶员模型在[24]中被提出,用于模拟 高速公路和城市交通。在我们最近的研究[25],中,设计了 一种类人跟车控制器以模仿人类驾驶行为。这些研究本质 上属于前馈模型,更适合用于模拟跟车行为而非实时控制。

自适应巡航控制系统作为定速巡航的升级,提高了驾 驶的便利性和安全性。多种控制方法已应用于自适应巡航 控制系统,例如比例‐积分(PI)控制 [26],模糊控制 [27], 和模型预测控制(MPC) [28],[29]。模型预测控制方法可 用于处理驾驶安全、燃油效率和乘坐舒适性等多目标优化 问题。在[30],中提出了一种场景MPC方法,可在多车道 和多车场景中实现预测性和预判性驾驶。通过使用随机建 模方法,确定了周围交通参与者的变道概率,并将其集成 到优化中。仿真结果表明,相较于PI控制,其对速度和加 速度的控制更加平滑。在[31],中,基于高速公路自然驾 驶数据生成了跟车间距模型,并将切入概率纳入MPC控 制算法中。模拟场景展示了车辆行驶的平顺性。尽管这些 方法考虑了相邻车道车辆的行为,但意图估计的方法仅通 过模拟数据进行了测试,而非真实交通数据。本研究中, 驾驶行为模型是从真实数据中学习得到的,所有测试均在 真实驾驶场景中进行。

总之,相邻车道的切入车辆往往会中断自适应巡航控 制系统的平稳可靠性能。行为估计模型至关重要 以提升自适应巡航控制系统的性能。本文重点研究从周围 车辆的外部信息中“随时”(即在线方式)预测切入意图。

所推断的切入概率被整合到模型预测控制框架中,以有效 应对接近目标车辆的突发行为变化。

III. 提出的方法

在NGSIM数据集中,提取了每辆车辆的独立场景, 其中周围车辆保持不变。使用高斯混合模型‐隐马尔可夫 模型学习两种类型的行为模型,即保持车道和变道。在测 试阶段,通过前向算法计算序列的似然,并与阈值进行比 较以实现最终识别。计算变道概率并将其集成到模型预测 控制框架中,以控制主车的跟车行为。

A. 场景定义与提取

下文将详细描述NGSIM数据集,并定义本文所使用的场景。

1) 数据描述:

本文使用了由美国联邦公路管理局资 助的NGSIM [32], a项目的单车轨迹公开数据集。这些轨 迹数据在交通研究历史上迄今是独一无二的,为结构化道 路上的驾驶行为研究提供了宝贵的依据。所有实验均基于 I‐80和US‐101的数据集进行。两个场景的道路结构如图3 所示。标注的场景数据已开源。1

示意图2

(a) I‐80 场景 (b) US‐101 场景

I‐80数据集包含三个15分钟时段:下午4:00至4:15、下午 5:00至5:15和下午5:15至5:30。这些时段分别代表拥堵的形成阶 段, 非拥堵与拥堵状态之间的过渡以及完全拥堵状态。 US‐101数据集共提供45分钟的数据,被划分为三个15分 钟时段:上午7:50至8:05、上午8:05至8:20和上午8:20至 8:35。两个数据集中的车辆轨迹均包含研究区域内每辆车 辆的精确位置,且数据以10赫兹的频率进行采样。

2) 场景分割:

图1中分割的场景具有以下属性:

  • 在每种场景中,目标车辆(Veh-h、Veh-p、Veh-f t、Veh-rt) 的周围车辆(Veh-t)保持不变。
    我们将缺失的周围车辆的相对距离设为150米,相对速度设为0。
    当目标车辆跨越车道线(并道)、超过Veh-p或让行于Veh-h时, 该场景结束。
  • 一旦前一场景结束,新的场景立即重新开始,以确保 驾驶场景之间的连续性。
  • 分割后的场景至少持续两秒钟,以确保完整的变道或车 道保持行为。
数据集 变道 车道保持
I‐80‐1 212(平均持续时间 6.12 秒) 16997(平均持续时间 6.01 秒)
I‐80‐2 159(平均持续时间 6.13 秒) 16972(平均持续时间 6.16 秒)
I‐80‐3 167(平均持续时间 6.30 秒) 15683(平均持续时间 6.26 秒)
US‐101‐1 242(平均持续时间 8.07 秒) 15683(平均持续时间 7.99 秒)
US‐101‐2 156(平均持续时间 8.56 秒) 17254(平均持续时间 8.07 秒)
US‐101‐3 154(平均持续时间 7.44 秒) 17796(平均持续时间 7.71 秒)

两个数据集中分割序列的汇总如表I所示。每个场景 分割的平均持续时间约为6到8秒。数据高度不平衡,即保 持车道的比例远高于变道,这给行为识别带来了另一项重 大挑战。然而,该数据比例与日常驾驶情况一致。根据参 考文献[14],[15],,表II中列出的特征被认为具有相关性并 被提取。

符号 描述
vx 车辆‐t的纵向速度
do 车辆‐t的横向速度
do 从目标车道线到Veh-t的横向偏移
∆vt,p Veh-t与Veh-p之间的纵向速度差
∆v t,h Veh-t与Veh-h之间的纵向速度差
∆vt,ft Veh-t与Veh-f t之间的纵向速度差
∆vt,rt Veh-t与Veh-rt之间的纵向速度差
∆x t,p Veh-t与Veh-p之间的纵向距离
∆x t,h Veh-t与Veh-h之间的纵向距离
∆x t,ft 车辆-t 与车辆-f t之间的纵向距离
∆x t,rt 车辆‐t 和 车辆‐rt 之间的纵向距离

B. 行为模型

隐马尔可夫模型由于其在描述动态过程和推断未观测 (隐藏)状态方面的强大能力,已被广泛用于建模驾驶行 为。高斯混合模型(GMMs)用于建模速度等连续观测值 的概率。

1) 高斯混合模型(GMM):

表II中的变量可分为以下 三类:

ξt=[[vx(t), vy(t), do(t)], [∆vt,p(t),∆vt,h(t),∆xt,p(t),∆xt,h(t)], [∆vt,ft(t),∆vt,rt(t),∆xt,ft(t),∆xt,rt(t)]] T

注意, ξt用于对本文中的行为进行建模,第一组[vx(t) vy(t) do(t)]T用于构建仅考虑目标车辆信息的模型。在本文 中,我们假设观测值 ξ的分布是多元高斯分布函数的加权 和:

p(ξt; θ)= ∑ K k=1 ωkN(ξt; µk,Σk) = ∑ K k=1 ωk · exp(−1 2(ξt − µk) TΣ−1 k(ξt − µk)) √(2π)11 det(Σk) (1)

其中 θ={θk} K k=1={ωk, µk,Σk} K k=1是高斯混合模型( GMMs)的参数, N(ξt; µk,Σk) 是均值中心为 µk ∈ R 11×1、 协方差矩阵为 Σk ∈ R 11×11的多元高斯分布, K是高斯混合 模型分量的数量,可通过贝叶斯信息准则(BIC)[34]确定。 由于 ωk ∈(0, 1]是第 kth个高斯分量的权重),我们有 ∑ K k=1 ωk= 1。

给定一个数据序列 ξ1:n,使用最大似然估计方法来寻 找一个 θ,使其最大化GMM函数的似然:

L(θ)= ∑ n t=1 ln(p(ξt; θ)) (2)

本文利用期望最大化算法来搜索最优参数 θ∗= arg max θ L(θ)

在步骤 j对 θ的估计表示为ˆθj。从ˆθj到ˆθj+1的迭代 通过以下E步和M-步[35]实现。

  • E步:在每次迭代中,使用先前的估计值ˆθj计算每个分 量 k的后验概率:

Pj +1 k(ξt) = ωˆj k · N(ξt ; µˆj k , Σˆj k) ∑ K l=1 ωˆ j l · N(ξt ; µˆ j l , Σˆ j l) (3)

  • M步:然后通过更新模型参数

ωˆ j +1 k = 1 n ∑ n t=1 P j +1 k(ξt)

µˆ j +1 k = ∑ n t=1(ξt · P j +1 k(ξt)) ∑ n t=1 P j +1 k(ξt)

Σˆ j +1 k = ∑ n t=1(P j +1 k(ξt)( ξ t − µˆ j +1 k)(ξt − µˆ j +1 k) T) ∑ n t=1 P j +1 k (ξt)

每次迭代结束时,通过对数似然 L(ˆθj+1)进行计算

L(θˆj+1)= ∑ n t=1 L(θˆj) (4)

迭代将继续,直到两个连续估计模型之间的似然差异 小于一个阈值,本文中该阈值设置为 10−10。

2) HMM:

建立两个独立的隐马尔可夫模型来表示变 道和保持车道的行为。本文中,隐马尔可夫模型的结构为 从左到右,如图2所示。该隐马尔可夫模型由 λ={S, Z, A, B, π}

其中

  • S={s1, · · ·, sN} 表示一组有限的 N 隐藏状态。
  • Z={ξt}是在时间 t观测到的所有状态 ξ的集合, 每个 ξ包含高斯混合模型(GMM)中的十一个元素。
  • A=[aij]是状态转移矩阵, aij被定义为从状态 si转移到 状态 sj的概率。
  • B={bi(ξ)}是观测模型, bi(ξ)表示在状态si下观察 到 ξ的概率。
  • π={πi}是初始状态分布,其中 πi表示状态 si 作为初始状态的概率。

读者可参考[36]以获取HMM更详细的公式化描述及 其应用。HMM是一种双重随机模型:一种是用于随机状 态转移的马尔可夫模型,另一种是每个状态中的随机观测。 选择三个隐状态来表示变道和车道保持行为背后的动态过 程。连续观测模型 B定义为

bi(ξ)= ∑ K k=1 ωkN(ξ; µk,Σk) (5)

Baum‐Welch算法[37]用于估计 λ两个隐马尔可 夫模型的参数。它是一种用于最大化观测值似然的近似迭 代优化技术。通过选择一组随机的初始参数,并利用梯度 更新进行优化改进。

3) 行为识别:

在测试阶段,以滚动时域方式实现二分 类识别,即变道或保持车道。假设序列 ξ 1:n是一个完整的 变道/保持车道周期,其中 n是序列长度。长度为s的最 短序列意味着区分两种行为所需的最少信息。如果 s< n, 则可以做出预测。流式数据 ξ 1:t ,其中 t ≥ s ,分别作 为实时输入馈送到 λlk和 λlc进行似然计算。 λlk和 λlc 分别表示保持车道和变道的隐马尔可夫模型(HMM)。

P(ξ1:t |λi) 通过前向算法[36]获得:

P(ξ1:t |λi) = ∑ N i=1 α t( i) (6)

where

αt+1(j)=( ∑ N i=1 αt(i) · aij) bj(ξt+1) α1(j)= πj bj(ξ1) (7)

由于没有关于特定驾驶员驾驶行为的先验知识,我们 假设各模型的先验概率相同。在计算 P(ξ1:t|λlk) 和 P( ξ1:t|λlc) 后,我们可以设置一个阈值来估计目标车辆的当 前行为:

R= P(ξ1:t|λlc) P(ξ1:t|λlk) (8)

其中 R表示分类更倾向于变道还是保持。

C. 模型预测控制

行为模型构建完成后,计算变道概率并将其集成到模 型预测控制框架中。

1) 意图估计:

变道意图概率按如下方式计算:

Pc= { tanh(ωc · R −RT Rm −RT) , R> RT 0, R ≤ RT (9)

其中 RT是分类阈值, Rm是从训练数据中获得的最大 比值, ωc是表示比值范围的跨度参数。因此,似然被归 一化为0到1之间的概率。选择“tanh”函数是因为训练 数据集中随机变量 R−RT Rm−RT 的值服从该分布时拟合误差最 小。

2) 预测模型:

本文中,车辆的纵向运动通过

x(t+1)= x(t)+ v(t)∆t+0.5a(t)∆t2 v(t+1)= v(t)+ a(t)∆t (10) 其中 x, v, a分别为主车的位置、速度和加速度, ∆t 为采样时间。然后定义以下变量:

  • 距离: ∆x= xf − xh其中xf为虚拟领航车的纵向位 置,且xf= Pcxt+(1 − Pc)xp。注意,如果概率 Pc为 1,则主车将假设目标车辆为前导车辆。
  • 相对速度: ∆v= vf−vh其中vf为虚拟领航车的纵向 速度,且vf= Pcvt+(1−Pc)vp。
  • 加速度:ah= jh∆t其中jh为主车的加加速度。

由于车辆运动的不确定性,我们假设周围车辆的加速 度在预测步骤中与参考文献[31]中的加速度保持一致。这 一假设是合理的,因为当更新前导车辆的实际状态时,模 型预测控制的预测窗口会持续后退到下一个时间点。

3) 滚动时域优化:

模型预测控制的代价函数设计用于满 足以下目标:

  • 跟踪误差:跟车控制的目标是在保持安全距离的同时 跟随前导车辆的速度。该距离定义为固定时间间隔策略 [30]:

ddes= d0+ τh1vh+ τh2∆v

其中 d0表示静止状态下的期望距离, τh1、τh2为固定 时间车头间距参数。

JT= ωd(ddes −∆x)2+ ωv∆v2 (11)

  • 舒适性与平顺性:主车应通过最小化其加速度和加加 速度来实现舒适且节能的驾驶模式。

JC= ωaa 2 h+ ωjj 2 h (12)

其中 ωd、 ωv、 ωa和 ωu是代价函数的权重值。

考虑到车辆的非完整约束和跟车场景,MPC设计中 还应考虑以下约束:

  • 主车的速度受限于 0 ≤ vh ≤ vmax
  • 与前导车辆的最小间距受以下约束: dsafe ≤∆x 其中 dsafe= τ0vh 是最小时间车头间距。
  • 主车的加速度约束为 amin ≤ ah ≤ amax
  • 主车的加加速度约束为 jmin ≤ jh ≤ jmax

优化问题现在可以写成:

min jh( k),k=1,···,N p J= JT+ JC (13)

其中 Np为预测步骤。该优化问题受上述约束条件限制。 注意,最优解是一个长度为 Np的控制值向量。模型预测 控制方法仅取第一个值,然后移动到下一个时间点并重新 开始优化。

四、实验结果

通过5折交叉验证实验验证了提出的方法的有效性。为 了平衡变道和保持车道的数据比例,随机选择了相同数量 的数据,即538个序列。首先,计算BIC值以确定GMM分 量的数量,其中 n t 是训练数据的长度ˆ, L是最大对数似 然。在拟合高斯混合模型(GMMs)时,通过增加 K可以 提高似然,但这可能导致过拟合。此外,对数似然可能具 有较大的负值,并且该方程中的这两部分 可能不在同一数量级上。设置归一化步骤以在参数数量和 对数似然之间进行权衡:

̂ BIC= ln(nt) · K − Kmin Kmax − Kmin − 2 · ln(Lˆ)− ln(Lˆ)min ln(Lˆ)max − ln(Lˆ)min

在此步骤中,使用每个数据集中的所有序列来计算 BIC值,其中 K从1变化到20。对于类似肘部的参数选择 [38],通常存在一个合理的范围。最终参数 K根据最小 归一化BIC值确定。然后,在I‐80数据集中, K= 3被 选用于变道和保持车道;在US‐101数据集中, K= 4被 选用于变道, K= 3被选用于保持车道。

A. 分类评估

为了突出周围车辆的影响,以下实验还研究了仅考虑 目标车辆信息的模型,该模型被标记为“tgt”,表示仅 考虑target vehicle。所提出的方法被标记为“srd”,表 示考虑surrounding vehicles。

受试者工作特征曲线是一种标准分析工具,用于评估 具有可变阈值(即本文中的 RT)的二分类分类器系统的 性能。曲线下面积(AUC)等于分类器将随机选择的正例 排在负例之前的概率(假设正例的排序高于负例)[39]。 在本文中,AUC表示行为估计的分类性能。当AUC(取 值范围为0到1)越大时,行为估计的准确率越高。如表 III所示,“srd”方法的AUC高于“tgt”方法,即考虑 周围车辆的行为估计分类结果比仅考虑目标车辆信息的结 果更准确。

案例 I II III IV V
srd‐I‐80 0.9603 0.9475 0.9418 0.9575 0.9356
tgt‐I‐80 0.9282 0.9064 0.9325 0.9046 0.9182
srd‐US‐101 0.9173 0.9295 0.9270 0.9358 0.9163
tgt‐US‐101 0.9065 0.9167 0.9058 0.8980 0.9007

除了AUC评估外,还引入了以下定量指标以进行全面评 估:

  • 真正例率(TPR),也称为召回率,是指在所有真实 事件中被正确分类的事件所占的分数,即 TPR= TP TP+ FN 其中,TP 表示真阳性,FN 表示假阴性(漏检)。
  • 假阳性率(FPR)是指在所有假事件中被错误分类的事 件所占的分数,即 FPR= FP FP+ TN 其中,FP 表示假阳性(误报),TN 表示真阴性。
数据集 案例 I II III IV V 平均
I-80 TPR srd 0.9158 0.8055 0.8056 0.8425 0.8037 0.8346
TPR tgt 0.7757 0.7407 0.8241 0.5278 0.6168 0.6971
FPR srd 0.0654 0.0648 0.0740 0.0740 0.0654 0.0688
FPR tgt 0.0841 0.0741 0.0648 0.0648 0.0654 0.0706
ACC srd 0.9252 0.8703 0.8657 0.8842 0.8691 0.8829
ACC tgt 0.8458 0.8333 0.8796 0.7315 0.7757 0.8132
PRE srd 0.9333 0.9255 0.9157 0.9191 0.9247 0.9237
PRE tgt 0.9022 0.9091 0.9271 0.8906 0.9041 0.9066
F1 srd 0.9245 0.8614 0.8571 0.8792 0.8600 0.8765
F1 tgt 0.8342 0.8163 0.8725 0.6627 0.7333 0.7838
US‐101 TPR srd 0.8091 0.7478 0.8108 0.8091 0.7727 0.7898
TPR tgt 0.6546 0.8378 0.8738 0.5909 0.7636 0.7441
FPR srd 0.0636 0.0811 0.0811 0.0909 0.0727 0.0778
FPR tgt 0.0909 0.0991 0.0901 0.1000 0.0909 0.0942
ACC srd 0.8727 0.8333 0.8648 0.8591 0.8501 0.8561
ACC tgt 0.7818 0.8694 0.8919 0.7455 0.8364 0.8249
PRE srd 0.9271 0.9022 0.9091 0.8989 0.9139 0.9103
PRE tgt 0.8781 0.8942 0.9066 0.8553 0.8936 0.8855
F1 srd 0.8641 0.8177 0.8571 0.8516 0.8374 0.8456
F1 tgt 0.7501 0.8651 0.8899 0.6989 0.8235 0.8055

阈值是通过在训练数据中选择假阳性率=5%来确定 的。然后,这些阈值被用于测试集中的最终评估(见表 IV中报告的结果)。评估结果表明,考虑周围车辆信息的 提出的方法比仅考虑目标车辆的方法具有更好的性能。

B. 变道预测

另一个挑战是在目标车辆跨越车道线之前预测其变道 行为。本文中,预测时间定义为 τt= te − tp 其中 te表示场景的结束时间, tp是首次达到变道标签的 时刻。在测试数据集中, te是目标车辆跨越车道线的时 间, tp是变道行为被估计的时间。当比率 R超过阈值时, 最终驾驶行为被估计为变道。此外,如果最终输出行为直 到场景结束仍保持为变道,则预测时间为 t p与 te之间的 时段。

案例 I II III IV V 平均
srd‐I‐80 5.16 5.21 4.97 3.11 3.49 4.39
tgt‐I‐80 4.12 3.42 2.99 2.58 2.49 3.12
srd‐US‐101 4.67 4.96 5.38 4.24 4.43 4.73
tgt‐US‐101 2.67 2.81 3.12 2.23 2.41 2.65

表五比较了“srd”和“tgt”的平均预测时间,表明提 出的方法是有效的 更早地预测目标车辆的意图。此外,还进行了使用支持向 量机(SVM)[12]进行变道预测的对比。采用高斯混合 模型‐隐马尔可夫模型(GMM‐HMM)的提出的方法结果 更优,因为驾驶行为是时间序列,且先前的状态与当前及 未来的状态相关。支持向量机(SVM)是一种只能输入 固定维度变量的分类器,因此无法对时间序列效应进行建 模。对比结果如图4和图5所示。提出的方法在提前0.5秒 预测变道行为时,真正例率约为80%,并在变道发生前4 秒时仍保持60%的真正例率。此外,提出的方法还具有最 低的假正例率,而支持向量机(SVM)方法的假正例率 则超过20%。

示意图3

示意图4

对时间序列序列进行建模时,支持向量机不稳定,并且在没 有滤波的情况下无法进行任何估计或预测。

C. 跟车测试结果

从NGSIM数据集中提取包含主车和目标车辆的场景 用于跟车控制测试。周围车辆的信息被用作主车的观测信 息。模型预测控制的参数列于表VI。

变量 单位
∆t 0.1 s
Np 20
ωc 10
d0 6 m
vmax 30 m/s
τ0, τh1, τh2 0.5, 1, 3 s
ωd, ωv, ωa, ω j 0.01,0.02,0.01,0.05
amin, amax −4, 6 m/s²
jmin, jmax −0.3, 0.3 m/s³

如表VII所示,选择了五项指标来评估提出的方法, 并比较了三种方法以说明切入情况的影响。“srd‐MPC” 表示所提出的方法,即通过考虑所有周围车辆的信息来估 计目标车辆的意图。“tgt‐MPC”表示仅使用目标车辆信 息估计意图的模型预测控制控制器。“Only‐MPC”是不 考虑目标车辆切入意图的纯模型预测控制方法。表VII中 列出的速度、加速度和加加速度为每次测试中的平均值。

危险指数定义为 HI= exp(−(∆x/h 1) h 2) 表示追尾碰撞的程度[40]。 h 1 和 h 2 的值是通过[31]中 的高速公路自然驾驶数据拟合得到的。碰撞率(CR)表示 在主车的仿真中,碰撞次数的结果表明,提出的方法的平 均速度接近传统MPC。通过目标车辆的意图估计,前车 突然变化的影响得到了平滑。同时,提出的方法的危险指 数和碰撞率远低于其他方法。需要注意的是,切入车辆的 轨迹作为真实随机输入(尽管在数据集中是固定的),用 于实验性地验证所提出方法的避碰控制效果。主车与切入 车辆之间的在线交互被省略,这是一个基本假设。

数据集 案例 I II III IV V 平均
I-80 vh (米/秒) srd‐MPC 6.3667 7.5950 6.2163 6.0926 6.1791 6.4899
vh (米/秒) tgt‐MPC 6.3292 7.5994 6.1411 5.8433 5.9667 6.3759
vh (米/秒) 仅MPC 6.9295 7.5845 6.2827 6.0988 6.2823 6.6356
ah (米/秒²) srd‐MPC 1.1624 1.0795 1.1589 1.1845 1.2646 1.1700
ah (米/秒²) tgt‐MPC 1.1974 1.5522 1.3786 1.2096 1.4739 1.3623
ah (米/秒²) 仅MPC 1.4067 1.5785 1.4746 1.3482 1.4555 1.4527
∆ah (米/秒³) srd‐MPC 0.1253 0.1399 0.1378 0.1409 0.1548 0.1397
∆ah (米/秒³) tgt‐MPC 0.1263 0.1836 0.1569 0.1498 0.1783 0.1590
∆ah (米/秒³) 仅MPC 0.1625 0.1892 0.1732 0.1606 0.1734 0.1718
HI srd‐MPC 0.0310 0.0214 0.2641 0.3888 0.4185 0.2248
HI tgt‐MPC 0.1245 0.4692 0.2650 0.4297 0.8305 0.4238
HI 仅MPC 0.6393 0.4705 0.2821 0.6097 0.9959 0.5995
CR srd‐MPC 0/29 0/22 1/25 2/25 2/21 0.0430
CR tgt‐MPC 1/29 3/22 1/25 3/25 3/21 0.0947
CR 仅MPC 4/29 3/22 1/25 4/25 4/21 0.1330
US‐101 vh (米/秒) srd‐MPC 10.1505 10.4960 10.2020 10.9406 9.7350 10.3048
vh (米/秒) tgt‐MPC 10.3989 10.7071 10.5165 11.0393 9.8605 10.5045
vh (米/秒) 仅MPC 10.6237 10.9072 10.6093 11.2079 9.8176 10.6331
ah (米/秒²) srd‐MPC 1.1609 1.3325 1.0661 1.7717 1.4109 1.3484
ah (米/秒²) tgt‐MPC 1.1632 1.6061 1.4135 1.8874 1.4795 1.5099
ah (米/秒²) 仅MPC 1.4798 1.6183 1.4058 1.9159 1.7556 1.6351
∆ah (米/秒³) srd‐MPC 0.1245 0.1526 0.1145 0.1787 0.1550 0.1451
∆ah (米/秒³) tgt‐MPC 0.1320 0.1710 0.1511 0.1841 0.1619 0.1600
∆ah (米/秒³) 仅MPC 0.1698 0.1730 0.1515 0.1827 0.1850 0.1724
HI srd‐MPC 0.2664 0.3675 0.1517 1.0301 0.4928 0.4617
HI tgt‐MPC 0.2865 0.8062 0.7836 1.2306 0.7578 0.7729
HI 仅MPC 0.6062 0.8269 1.1758 1.3458 1.0394 0.9988
CR srd‐MPC 2/35 2/28 1/40 6/31 2/36 0.0805
CR tgt‐MPC 2/35 6/28 5/40 8/31 4/36 0.1531
CR 仅MPC 4/35 6/28 8/40 8/31 6/36 0.1907

从测试数据中选取了两个详细示例,以说明提出的方 法在图7和图8中的优势,其中真实数据来自数据集中的驾 驶员操作。第一个示例是I‐80数据集中的一个切入场景, 如图7所示。在此场景中,当目标车辆速度较慢并希望让 行后方更快的跟随车辆时,发生了切入行为。如图7(d)所 示,提出的方法在1.8 s时检测到目标车辆的变道意图,而 目标车辆在7.3 s时跨越车道线,此时相对距离的突变如图 7(b)所示。若仅使用目标车辆信息,则变道意图直到6.6 s才被检测到。通过使用提出的方法,主车能够在切入发 生前更早地实施减速干预控制,从而获得平滑加速度,并 避免紧急制动。

另一个来自US‐101数据集的示例如图8所示。在此场 景中,目标车辆试图并入主车车道以加速。提出的方法在 1.1秒时估计出切入行为,而目标车辆在8.2秒时跨越车道 线。与上一个场景类似,在加加速度子图中可以看到更早 且更平滑的控制。如果没有意图估计,由纯模型预测控制 控制的主车由于突然切入而未能避免碰撞。

示意图5

示意图6

五、结论

本文提出了一种结合其他交通参与者变道行为估计的 跟车控制方法。利用目标车辆及其周围车辆的多变量时间 序列数据,构建了两个连续隐马尔可夫模型(HMM), 分别表示变道行为和保持车道行为。采用基于阈值的分类 方法对目标车辆的行为进行估计。同时,基于行为估计结 果计算切入概率,并应用模型预测控制方法优化主车的跟 车行为。该目标车辆行为模型的真正例率可达85%以上, 且能在目标车辆跨越车道线前约4秒预测其变道行为。所 提出的基于意图的模型预测控制在安全性和乘坐舒适性方 面表现出更优的性能。

未来,我们将在更复杂的场景(如交叉路口)中研究 基于意图预测的策略。复杂模型的解释也是一个研究方向。 类似时间自动机的洞察模型将作为一种有前景的替代方案。

您可能感兴趣的与本文相关的镜像

GPT-SoVITS

GPT-SoVITS

AI应用

GPT-SoVITS 是一个开源的文本到语音(TTS)和语音转换模型,它结合了 GPT 的生成能力和 SoVITS 的语音转换技术。该项目以其强大的声音克隆能力而闻名,仅需少量语音样本(如5秒)即可实现高质量的即时语音合成,也可通过更长的音频(如1分钟)进行微调以获得更逼真的效果

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值