基于意图估计的自动驾驶跟车控制

原创于 2025-10-14 06:52:52 发布 · 782 阅读

11 ·

CC 4.0 BY-SA版权

文章标签：

#变道意图 # 跟车控制 # 模型预测控制 # HMM-GMM # NGSIM

部署运行你感兴趣的模型镜像

自动驾驶中用于跟车控制的变道意图估计

摘要

跟车是高速公路驾驶中最常见的行为。为了实现安全与协作驾驶，识别来自相邻车道车辆的切入意图至关重要。本文提出了一种行为估计方法，基于上下文交通信息来识别和预测变道意图。设计了一个模型预测控制器，通过融合其他车辆的变道意图来优化加速度序列。对下一代模拟的公开数据集进行了标签标注，并发布为研究社区的基准测试平台。实验结果表明，提出的方法能够准确估计车辆行为，从而优于传统跟车控制。

索引术语

协作式跟车，驾驶行为估计，变道预测，模型预测控制。

一、引言

最近，许多研究机构和汽车制造商都将重点放在自动驾驶系统的商业化上。自动驾驶汽车在道路上的安全性和可靠性至关重要。大多数交通事故是由人为错误引起的，其中许多事故发生在变道过程中[1],[2]。此外，少于50% 的驾驶员在变道时使用转向灯[3]。为了确保行车安全，自动驾驶汽车在周围车辆跨越车道线之前，准确估计其驾驶行为并预测其变道意图显得尤为重要。

示意图0

图1展示了高速公路驾驶中的场景。自动驾驶汽车被标记为主车（蓝色，Veh-h），目标车辆为红色（Veh-t），前车（Veh-p）位于主车前方，Veh-f t和Veh-rt分别表示目标车道内的前后车辆。假设红色车辆正在跟随前导车辆并意图并道。在此情况下，如果主车无法估计红色车辆的汇入意图，则可能发生加速度的突然变化，导致不舒适甚至危险的情况。人类驾驶员基于观测值和驾驶经验来预测周围车辆的行为（是否会汇入本车道）。自动驾驶汽车则使用计算模型来模拟人类，估计自身及周围车辆的状态。

应估计目标车辆的切入意图，以确保主车的安全和舒适性跟车。

张一环和王军隶属于中华人民共和国上海市同济大学控制科学与工程系，邮编201804。林勤和西科·弗尔韦尔隶属于荷兰代尔夫特理工大学智能系统系，代尔夫特，邮编2628 CD。约翰·M·多兰隶属于美利坚合众国宾夕法尼亚州匹兹堡市卡内基梅隆大学机器人研究所。

∗通讯作者 junwang@tongji.edu.cn

车辆‐h
车辆‐t
车辆‐p
车辆‐ft 车辆‐rt
车辆‐h
车辆‐t
车辆‐p
车辆‐ft 车属‐rt
变道：
切入
车辆‐h
车辆‐t
车辆‐p
车辆‐ft 车辆‐rt
保持车道：
无切入

利用四个周围车辆的上下文信息来建模目标车辆的驾驶行为。本文需要将观测值（车辆位置、横向加速度等）识别/ 分类为变道或保持车道。这是一个基于观测值的标准多元时间序列分类问题，即为完整的变道或保持车道序列分配一个标签。本研究旨在实现一个更具挑战性的任务，即提前预测该标签（即意图），以实现控制干预。

尽管自适应巡航控制（ACC）系统自 1995[4],以来已进入市场，但其在平顺性方面的性能经常受到来自相邻车道切入车辆的干扰。为了实现更可靠的ACC，应更加关注其他车辆的意图。本文提出了一种基于意图的跟车控制方法，通过融合周围车辆的切入意图来实现。

示意图1

图2展示了所提出方法的框架。首先，使用场景提取方法获取两类驾驶序列：变道和保持车道。然后，采用结合高斯混合模型（GMM）的连续隐马尔可夫模型（ HMM）分别对变道和保持车道行为进行建模。利用似然函数以在线方式估计行为。最后，提出了一种模型预测控制框架来考虑预测的切入意图。

本文的主要贡献如下：据我们所知，这是首次将交通上下文信息融入驾驶行为的研究

二. 相关工作

相关工作分为两部分：一部分是利用各种信息进行驾驶行为的估计与预测，另一部分是关于跟车控制，包括数学模型、控制方法和自适应巡航控制系统。

驾驶行为分类

许多研究聚焦于驾驶行为的分类与预测。在[5],中，使用隐马尔可夫模型（HMM）和高斯混合模型对跟车和超车行为进行了建模与识别。在[6],中，提出了一种基于操作的方法，用于估计驾驶员的驾驶状态，并结合前导车辆的信息预测其未来轨迹。在跟车场景中，监测相邻车道的情况对于应对变道行为至关重要。

变道行为估计或意图识别可根据其输入信号分为两类。

第一类使用目标车辆的internal信息，例如油门踏板压力、制动踏板压力和方向盘角度，来识别驾驶行为。它是一种主要用于高级驾驶辅助系统。在[7],中，基于车辆加速度、制动和转向数据，在47个记录的变道场景中实现了93.3% 的准确率。在[8],中，使用横向加速度、方向盘角度和转向角度，通过连续隐马尔可夫模型对保持车道和变道操作进行分类，变道的平均识别率超过90%。在[9],中，利用从车辆状态和驾驶员操作信号中提取的特征识别变道操作。该数据集由不同驾驶员在不同驾驶条件下记录，识别率为88.2%。在[10],中，添加了眼动和头部动态等额外特征以提升行为识别的准确率。在[11],中，利用心电图、皮肤电反应和呼吸信号训练了一个多层神经网络模型，实现了在目标车辆实际跨越车道线前约2秒预测变道。

另一类使用目标车辆的外部信息，例如车速、横向偏移、距离等。由于所有参数均可通过车载传感器测量，自动驾驶汽车可以据此估计周围车辆的行为。在[12],中，横向位置和相对航向角被用作特征来训练支持向量机（ SVM），并使用贝叶斯滤波器获得驾驶行为的概率。然而，周围车辆对目标车辆行为的影响不应被忽略。越来越多的研究人员在研究驾驶行为时考虑了周围交通情况。在 [13],中，变道意图是基于驾驶员头部动作、内部信号以及周围车辆的信息进行估计的。该分类器能够更准确地提供驾驶员的意图。

下一代模拟（NGSIM）数据集已被用于探索警觉变道过程的特征。在[14],中，使用模糊推理系统根据距离做出变道决策

和相对速度。在[15],中，应用了一种基于神经网络的学习方法来建模变道行为。作为经典机器学习方法的基于支持向量机的分类能够处理高维输入特征。在[16],[17],中，使用支持向量机对不同的变道行为情况进行分类，并利用周围车辆的不同输入特征来训练支持向量机。此外，在 [18],[19]中应用了基于贝叶斯网络的概率分类方法。目标车辆与周围车辆之间的碰撞时间被用作输入特征，以获得变道行为的概率。在[20]中，利用NGSIM数据提出了一个变道指数概率模型。多种因素被认为会影响变道决策，包括目标车辆与原始车道之间的相对速度以及目标车辆与周围车辆之间的距离。

B. 跟车控制

关于跟车的首项工作可追溯到20世纪50年代。在[21], 中提出了一种线性前车跟随模型，通过使用后随车辆与前导车辆之间的相对速度来计算期望加速度。另一种广泛使用的线性模型是赫利模型，于[22]中提出。此外，非线性的Gazis‐Herman‐Rothery模型引入了距离和速度的幂运算符[23]。智能驾驶员模型在[24]中被提出，用于模拟高速公路和城市交通。在我们最近的研究[25],中，设计了一种类人跟车控制器以模仿人类驾驶行为。这些研究本质上属于前馈模型，更适合用于模拟跟车行为而非实时控制。

自适应巡航控制系统作为定速巡航的升级，提高了驾驶的便利性和安全性。多种控制方法已应用于自适应巡航控制系统，例如比例‐积分(PI)控制 [26],模糊控制 [27], 和模型预测控制(MPC) [28],[29]。模型预测控制方法可用于处理驾驶安全、燃油效率和乘坐舒适性等多目标优化问题。在[30],中提出了一种场景MPC方法，可在多车道和多车场景中实现预测性和预判性驾驶。通过使用随机建模方法，确定了周围交通参与者的变道概率，并将其集成到优化中。仿真结果表明，相较于PI控制，其对速度和加速度的控制更加平滑。在[31],中，基于高速公路自然驾驶数据生成了跟车间距模型，并将切入概率纳入MPC控制算法中。模拟场景展示了车辆行驶的平顺性。尽管这些方法考虑了相邻车道车辆的行为，但意图估计的方法仅通过模拟数据进行了测试，而非真实交通数据。本研究中，驾驶行为模型是从真实数据中学习得到的，所有测试均在真实驾驶场景中进行。

总之，相邻车道的切入车辆往往会中断自适应巡航控制系统的平稳可靠性能。行为估计模型至关重要以提升自适应巡航控制系统的性能。本文重点研究从周围车辆的外部信息中“随时”（即在线方式）预测切入意图。

所推断的切入概率被整合到模型预测控制框架中，以有效应对接近目标车辆的突发行为变化。

III. 提出的方法

在NGSIM数据集中，提取了每辆车辆的独立场景，其中周围车辆保持不变。使用高斯混合模型‐隐马尔可夫模型学习两种类型的行为模型，即保持车道和变道。在测试阶段，通过前向算法计算序列的似然，并与阈值进行比较以实现最终识别。计算变道概率并将其集成到模型预测控制框架中，以控制主车的跟车行为。

A. 场景定义与提取

下文将详细描述NGSIM数据集，并定义本文所使用的场景。

1) 数据描述：

本文使用了由美国联邦公路管理局资助的NGSIM [32], a项目的单车轨迹公开数据集。这些轨迹数据在交通研究历史上迄今是独一无二的，为结构化道路上的驾驶行为研究提供了宝贵的依据。所有实验均基于 I‐80和US‐101的数据集进行。两个场景的道路结构如图3 所示。标注的场景数据已开源。1

示意图2

(a) I‐80 场景 (b) US‐101 场景

I‐80数据集包含三个15分钟时段：下午4:00至4:15、下午 5:00至5:15和下午5:15至5:30。这些时段分别代表拥堵的形成阶段，非拥堵与拥堵状态之间的过渡以及完全拥堵状态。 US‐101数据集共提供45分钟的数据，被划分为三个15分钟时段：上午7:50至8:05、上午8:05至8:20和上午8:20至 8:35。两个数据集中的车辆轨迹均包含研究区域内每辆车辆的精确位置，且数据以10赫兹的频率进行采样。

2) 场景分割：

图1中分割的场景具有以下属性：

在每种场景中，目标车辆（Veh-h、Veh-p、Veh-f t、Veh-rt）的周围车辆（Veh-t）保持不变。
我们将缺失的周围车辆的相对距离设为150米，相对速度设为0。
当目标车辆跨越车道线（并道）、超过Veh-p或让行于Veh-h时，该场景结束。
一旦前一场景结束，新的场景立即重新开始，以确保驾驶场景之间的连续性。
分割后的场景至少持续两秒钟，以确保完整的变道或车道保持行为。

数据集	变道	车道保持
I‐80‐1	212（平均持续时间 6.12 秒）	16997（平均持续时间 6.01 秒）
I‐80‐2	159（平均持续时间 6.13 秒）	16972（平均持续时间 6.16 秒）
I‐80‐3	167（平均持续时间 6.30 秒）	15683（平均持续时间 6.26 秒）
US‐101‐1	242（平均持续时间 8.07 秒）	15683（平均持续时间 7.99 秒）
US‐101‐2	156（平均持续时间 8.56 秒）	17254（平均持续时间 8.07 秒）
US‐101‐3	154（平均持续时间 7.44 秒）	17796（平均持续时间 7.71 秒）

两个数据集中分割序列的汇总如表I所示。每个场景分割的平均持续时间约为6到8秒。数据高度不平衡，即保持车道的比例远高于变道，这给行为识别带来了另一项重大挑战。然而，该数据比例与日常驾驶情况一致。根据参考文献[14],[15],，表II中列出的特征被认为具有相关性并被提取。

符号	描述
vx	车辆‐t的纵向速度
do	车辆‐t的横向速度
do	从目标车道线到Veh-t的横向偏移
∆vt,p	Veh-t与Veh-p之间的纵向速度差
∆v t,h	Veh-t与Veh-h之间的纵向速度差
∆vt,ft	Veh-t与Veh-f t之间的纵向速度差
∆vt,rt	Veh-t与Veh-rt之间的纵向速度差
∆x t,p	Veh-t与Veh-p之间的纵向距离
∆x t,h	Veh-t与Veh-h之间的纵向距离
∆x t,ft	车辆-t 与车辆-f t之间的纵向距离
∆x t,rt	车辆‐t 和车辆‐rt 之间的纵向距离

B. 行为模型

隐马尔可夫模型由于其在描述动态过程和推断未观测（隐藏）状态方面的强大能力，已被广泛用于建模驾驶行为。高斯混合模型（GMMs）用于建模速度等连续观测值的概率。

1) 高斯混合模型（GMM）：

表II中的变量可分为以下三类：

ξt=[[vx(t), vy(t), do(t)], [∆vt,p(t),∆vt,h(t),∆xt,p(t),∆xt,h(t)], [∆vt,ft(t),∆vt,rt(t),∆xt,ft(t),∆xt,rt(t)]] T

注意， ξt用于对本文中的行为进行建模，第一组[vx(t) vy(t) do(t)]T用于构建仅考虑目标车辆信息的模型。在本文中，我们假设观测值 ξ的分布是多元高斯分布函数的加权和：

p(ξt; θ)= ∑ K k=1 ωkN(ξt; µk,Σk) = ∑ K k=1 ωk · exp(−1 2(ξt − µk) TΣ−1 k(ξt − µk)) √(2π)11 det(Σk) (1)

其中 θ={θk} K k=1={ωk, µk,Σk} K k=1是高斯混合模型（ GMMs）的参数， N(ξt; µk,Σk) 是均值中心为 µk ∈ R 11×1、协方差矩阵为 Σk ∈ R 11×11的多元高斯分布， K是高斯混合模型分量的数量，可通过贝叶斯信息准则（BIC）[34]确定。由于 ωk ∈（0, 1]是第 kth个高斯分量的权重），我们有 ∑ K k=1 ωk= 1。

给定一个数据序列 ξ1:n，使用最大似然估计方法来寻找一个 θ，使其最大化GMM函数的似然：

L(θ)= ∑ n t=1 ln(p(ξt; θ)) (2)

本文利用期望最大化算法来搜索最优参数 θ∗= arg max θ L(θ)

在步骤 j对 θ的估计表示为ˆθj。从ˆθj到ˆθj+1的迭代通过以下E步和M-步[35]实现。

E步：在每次迭代中，使用先前的估计值ˆθj计算每个分量 k的后验概率：

Pj +1 k(ξt) = ωˆj k · N(ξt ; µˆj k , Σˆj k) ∑ K l=1 ωˆ j l · N(ξt ; µˆ j l , Σˆ j l) (3)

M步：然后通过更新模型参数

ωˆ j +1 k = 1 n ∑ n t=1 P j +1 k(ξt)

µˆ j +1 k = ∑ n t=1(ξt · P j +1 k(ξt)) ∑ n t=1 P j +1 k(ξt)

Σˆ j +1 k = ∑ n t=1(P j +1 k(ξt)( ξ t − µˆ j +1 k)(ξt − µˆ j +1 k) T) ∑ n t=1 P j +1 k (ξt)

每次迭代结束时，通过对数似然 L(ˆθj+1)进行计算

L(θˆj+1)= ∑ n t=1 L(θˆj) (4)

迭代将继续，直到两个连续估计模型之间的似然差异小于一个阈值，本文中该阈值设置为 10−10。

2) HMM：

建立两个独立的隐马尔可夫模型来表示变道和保持车道的行为。本文中，隐马尔可夫模型的结构为从左到右，如图2所示。该隐马尔可夫模型由 λ={S, Z, A, B, π}

其中

S={s1, · · ·, sN} 表示一组有限的 N 隐藏状态。
Z={ξt}是在时间 t观测到的所有状态 ξ的集合，每个 ξ包含高斯混合模型（GMM）中的十一个元素。
A=[aij]是状态转移矩阵， aij被定义为从状态 si转移到状态 sj的概率。
B={bi(ξ)}是观测模型， bi(ξ)表示在状态si下观察到 ξ的概率。
π={πi}是初始状态分布，其中 πi表示状态 si 作为初始状态的概率。

读者可参考[36]以获取HMM更详细的公式化描述及其应用。HMM是一种双重随机模型：一种是用于随机状态转移的马尔可夫模型，另一种是每个状态中的随机观测。选择三个隐状态来表示变道和车道保持行为背后的动态过程。连续观测模型 B定义为

bi(ξ)= ∑ K k=1 ωkN(ξ; µk,Σk) (5)

Baum‐Welch算法[37]用于估计 λ两个隐马尔可夫模型的参数。它是一种用于最大化观测值似然的近似迭代优化技术。通过选择一组随机的初始参数，并利用梯度更新进行优化改进。

3) 行为识别：

在测试阶段，以滚动时域方式实现二分类识别，即变道或保持车道。假设序列 ξ 1:n是一个完整的变道/保持车道周期，其中 n是序列长度。长度为s的最短序列意味着区分两种行为所需的最少信息。如果 s< n，则可以做出预测。流式数据 ξ 1:t ，其中 t ≥ s ，分别作为实时输入馈送到 λlk和 λlc进行似然计算。 λlk和 λlc 分别表示保持车道和变道的隐马尔可夫模型（HMM）。

P(ξ1:t |λi) 通过前向算法[36]获得：

P(ξ1:t |λi) = ∑ N i=1 α t( i) (6)

where

αt+1(j)=( ∑ N i=1 αt(i) · aij) bj(ξt+1) α1(j)= πj bj(ξ1) (7)

由于没有关于特定驾驶员驾驶行为的先验知识，我们假设各模型的先验概率相同。在计算 P(ξ1:t|λlk) 和 P( ξ1:t|λlc) 后，我们可以设置一个阈值来估计目标车辆的当前行为：

R= P(ξ1:t|λlc) P(ξ1:t|λlk) (8)

其中 R表示分类更倾向于变道还是保持。

C. 模型预测控制

行为模型构建完成后，计算变道概率并将其集成到模型预测控制框架中。

1) 意图估计：

变道意图概率按如下方式计算：

Pc= { tanh(ωc · R −RT Rm −RT) , R> RT 0, R ≤ RT (9)

其中 RT是分类阈值， Rm是从训练数据中获得的最大比值， ωc是表示比值范围的跨度参数。因此，似然被归一化为0到1之间的概率。选择“tanh”函数是因为训练数据集中随机变量 R−RT Rm−RT 的值服从该分布时拟合误差最小。

2) 预测模型：

本文中，车辆的纵向运动通过

x(t+1)= x(t)+ v(t)∆t+0.5a(t)∆t2 v(t+1)= v(t)+ a(t)∆t (10) 其中 x, v, a分别为主车的位置、速度和加速度， ∆t 为采样时间。然后定义以下变量：

距离： ∆x= xf − xh其中xf为虚拟领航车的纵向位置，且xf= Pcxt+(1 − Pc)xp。注意，如果概率 Pc为 1，则主车将假设目标车辆为前导车辆。
相对速度： ∆v= vf−vh其中vf为虚拟领航车的纵向速度，且vf= Pcvt+(1−Pc)vp。
加速度：ah= jh∆t其中jh为主车的加加速度。

由于车辆运动的不确定性，我们假设周围车辆的加速度在预测步骤中与参考文献[31]中的加速度保持一致。这一假设是合理的，因为当更新前导车辆的实际状态时，模型预测控制的预测窗口会持续后退到下一个时间点。

3) 滚动时域优化：

模型预测控制的代价函数设计用于满足以下目标：

跟踪误差：跟车控制的目标是在保持安全距离的同时跟随前导车辆的速度。该距离定义为固定时间间隔策略 [30]：

ddes= d0+ τh1vh+ τh2∆v

其中 d0表示静止状态下的期望距离， τh1、τh2为固定时间车头间距参数。

JT= ωd(ddes −∆x)2+ ωv∆v2 (11)

舒适性与平顺性：主车应通过最小化其加速度和加加速度来实现舒适且节能的驾驶模式。

JC= ωaa 2 h+ ωjj 2 h (12)

其中 ωd、 ωv、 ωa和 ωu是代价函数的权重值。

考虑到车辆的非完整约束和跟车场景，MPC设计中还应考虑以下约束：

主车的速度受限于 0 ≤ vh ≤ vmax
与前导车辆的最小间距受以下约束： dsafe ≤∆x 其中 dsafe= τ0vh 是最小时间车头间距。
主车的加速度约束为 amin ≤ ah ≤ amax
主车的加加速度约束为 jmin ≤ jh ≤ jmax

优化问题现在可以写成：

min jh( k),k=1,···,N p J= JT+ JC (13)

其中 Np为预测步骤。该优化问题受上述约束条件限制。注意，最优解是一个长度为 Np的控制值向量。模型预测控制方法仅取第一个值，然后移动到下一个时间点并重新开始优化。

四、实验结果

通过5折交叉验证实验验证了提出的方法的有效性。为了平衡变道和保持车道的数据比例，随机选择了相同数量的数据，即538个序列。首先，计算BIC值以确定GMM分量的数量，其中 n t 是训练数据的长度ˆ， L是最大对数似然。在拟合高斯混合模型（GMMs）时，通过增加 K可以提高似然，但这可能导致过拟合。此外，对数似然可能具有较大的负值，并且该方程中的这两部分可能不在同一数量级上。设置归一化步骤以在参数数量和对数似然之间进行权衡：

̂ BIC= ln(nt) · K − Kmin Kmax − Kmin − 2 · ln(Lˆ)− ln(Lˆ)min ln(Lˆ)max − ln(Lˆ)min

在此步骤中，使用每个数据集中的所有序列来计算 BIC值，其中 K从1变化到20。对于类似肘部的参数选择 [38]，通常存在一个合理的范围。最终参数 K根据最小归一化BIC值确定。然后，在I‐80数据集中， K= 3被选用于变道和保持车道；在US‐101数据集中， K= 4被选用于变道， K= 3被选用于保持车道。

A. 分类评估

为了突出周围车辆的影响，以下实验还研究了仅考虑目标车辆信息的模型，该模型被标记为“tgt”，表示仅考虑target vehicle。所提出的方法被标记为“srd”，表示考虑surrounding vehicles。

受试者工作特征曲线是一种标准分析工具，用于评估具有可变阈值（即本文中的 RT）的二分类分类器系统的性能。曲线下面积（AUC）等于分类器将随机选择的正例排在负例之前的概率（假设正例的排序高于负例）[39]。在本文中，AUC表示行为估计的分类性能。当AUC（取值范围为0到1）越大时，行为估计的准确率越高。如表 III所示，“srd”方法的AUC高于“tgt”方法，即考虑周围车辆的行为估计分类结果比仅考虑目标车辆信息的结果更准确。

案例	I	II	III	IV	V
srd‐I‐80	0.9603	0.9475	0.9418	0.9575	0.9356
tgt‐I‐80	0.9282	0.9064	0.9325	0.9046	0.9182
srd‐US‐101	0.9173	0.9295	0.9270	0.9358	0.9163
tgt‐US‐101	0.9065	0.9167	0.9058	0.8980	0.9007

除了AUC评估外，还引入了以下定量指标以进行全面评估：

真正例率（TPR），也称为召回率，是指在所有真实事件中被正确分类的事件所占的分数，即 TPR= TP TP+ FN 其中，TP 表示真阳性，FN 表示假阴性（漏检）。
假阳性率（FPR）是指在所有假事件中被错误分类的事件所占的分数，即 FPR= FP FP+ TN 其中，FP 表示假阳性（误报），TN 表示真阴性。

数据集	案例	I	II	III	IV	V	平均
I-80	TPR srd	0.9158	0.8055	0.8056	0.8425	0.8037	0.8346
	TPR tgt	0.7757	0.7407	0.8241	0.5278	0.6168	0.6971
	FPR srd	0.0654	0.0648	0.0740	0.0740	0.0654	0.0688
	FPR tgt	0.0841	0.0741	0.0648	0.0648	0.0654	0.0706
	ACC srd	0.9252	0.8703	0.8657	0.8842	0.8691	0.8829
	ACC tgt	0.8458	0.8333	0.8796	0.7315	0.7757	0.8132
	PRE srd	0.9333	0.9255	0.9157	0.9191	0.9247	0.9237
	PRE tgt	0.9022	0.9091	0.9271	0.8906	0.9041	0.9066
	F1 srd	0.9245	0.8614	0.8571	0.8792	0.8600	0.8765
	F1 tgt	0.8342	0.8163	0.8725	0.6627	0.7333	0.7838
US‐101	TPR srd	0.8091	0.7478	0.8108	0.8091	0.7727	0.7898
	TPR tgt	0.6546	0.8378	0.8738	0.5909	0.7636	0.7441
	FPR srd	0.0636	0.0811	0.0811	0.0909	0.0727	0.0778
	FPR tgt	0.0909	0.0991	0.0901	0.1000	0.0909	0.0942
	ACC srd	0.8727	0.8333	0.8648	0.8591	0.8501	0.8561
	ACC tgt	0.7818	0.8694	0.8919	0.7455	0.8364	0.8249
	PRE srd	0.9271	0.9022	0.9091	0.8989	0.9139	0.9103
	PRE tgt	0.8781	0.8942	0.9066	0.8553	0.8936	0.8855
	F1 srd	0.8641	0.8177	0.8571	0.8516	0.8374	0.8456
	F1 tgt	0.7501	0.8651	0.8899	0.6989	0.8235	0.8055

阈值是通过在训练数据中选择假阳性率=5%来确定的。然后，这些阈值被用于测试集中的最终评估（见表 IV中报告的结果）。评估结果表明，考虑周围车辆信息的提出的方法比仅考虑目标车辆的方法具有更好的性能。

B. 变道预测

另一个挑战是在目标车辆跨越车道线之前预测其变道行为。本文中，预测时间定义为 τt= te − tp 其中 te表示场景的结束时间， tp是首次达到变道标签的时刻。在测试数据集中， te是目标车辆跨越车道线的时间， tp是变道行为被估计的时间。当比率 R超过阈值时，最终驾驶行为被估计为变道。此外，如果最终输出行为直到场景结束仍保持为变道，则预测时间为 t p与 te之间的时段。

案例	I	II	III	IV	V	平均
srd‐I‐80	5.16	5.21	4.97	3.11	3.49	4.39
tgt‐I‐80	4.12	3.42	2.99	2.58	2.49	3.12
srd‐US‐101	4.67	4.96	5.38	4.24	4.43	4.73
tgt‐US‐101	2.67	2.81	3.12	2.23	2.41	2.65

表五比较了“srd”和“tgt”的平均预测时间，表明提出的方法是有效的更早地预测目标车辆的意图。此外，还进行了使用支持向量机（SVM）[12]进行变道预测的对比。采用高斯混合模型‐隐马尔可夫模型（GMM‐HMM）的提出的方法结果更优，因为驾驶行为是时间序列，且先前的状态与当前及未来的状态相关。支持向量机（SVM）是一种只能输入固定维度变量的分类器，因此无法对时间序列效应进行建模。对比结果如图4和图5所示。提出的方法在提前0.5秒预测变道行为时，真正例率约为80%，并在变道发生前4 秒时仍保持60%的真正例率。此外，提出的方法还具有最低的假正例率，而支持向量机（SVM）方法的假正例率则超过20%。

示意图3

示意图4

对时间序列序列进行建模时，支持向量机不稳定，并且在没有滤波的情况下无法进行任何估计或预测。

C. 跟车测试结果

从NGSIM数据集中提取包含主车和目标车辆的场景用于跟车控制测试。周围车辆的信息被用作主车的观测信息。模型预测控制的参数列于表VI。

变量	值	单位
∆t	0.1	s
Np	20	−
ωc	10	−
d0	6	m
vmax	30	m/s
τ0, τh1, τh2	0.5, 1, 3	s
ωd, ωv, ωa, ω j	0.01，0.02，0.01，0.05	−
amin, amax	−4, 6	m/s²
jmin, jmax	−0.3, 0.3	m/s³

如表VII所示，选择了五项指标来评估提出的方法，并比较了三种方法以说明切入情况的影响。“srd‐MPC” 表示所提出的方法，即通过考虑所有周围车辆的信息来估计目标车辆的意图。“tgt‐MPC”表示仅使用目标车辆信息估计意图的模型预测控制控制器。“Only‐MPC”是不考虑目标车辆切入意图的纯模型预测控制方法。表VII中列出的速度、加速度和加加速度为每次测试中的平均值。

危险指数定义为 HI= exp(−(∆x/h 1) h 2) 表示追尾碰撞的程度[40]。 h 1 和 h 2 的值是通过[31]中的高速公路自然驾驶数据拟合得到的。碰撞率(CR)表示在主车的仿真中，碰撞次数的结果表明，提出的方法的平均速度接近传统MPC。通过目标车辆的意图估计，前车突然变化的影响得到了平滑。同时，提出的方法的危险指数和碰撞率远低于其他方法。需要注意的是，切入车辆的轨迹作为真实随机输入（尽管在数据集中是固定的），用于实验性地验证所提出方法的避碰控制效果。主车与切入车辆之间的在线交互被省略，这是一个基本假设。

数据集	案例	I	II	III	IV	V	平均
I-80	vh (米/秒) srd‐MPC	6.3667	7.5950	6.2163	6.0926	6.1791	6.4899
	vh (米/秒) tgt‐MPC	6.3292	7.5994	6.1411	5.8433	5.9667	6.3759
	vh (米/秒) 仅MPC	6.9295	7.5845	6.2827	6.0988	6.2823	6.6356
	ah (米/秒²) srd‐MPC	1.1624	1.0795	1.1589	1.1845	1.2646	1.1700
	ah (米/秒²) tgt‐MPC	1.1974	1.5522	1.3786	1.2096	1.4739	1.3623
	ah (米/秒²) 仅MPC	1.4067	1.5785	1.4746	1.3482	1.4555	1.4527
	∆ah (米/秒³) srd‐MPC	0.1253	0.1399	0.1378	0.1409	0.1548	0.1397
	∆ah (米/秒³) tgt‐MPC	0.1263	0.1836	0.1569	0.1498	0.1783	0.1590
	∆ah (米/秒³) 仅MPC	0.1625	0.1892	0.1732	0.1606	0.1734	0.1718
	HI srd‐MPC	0.0310	0.0214	0.2641	0.3888	0.4185	0.2248
	HI tgt‐MPC	0.1245	0.4692	0.2650	0.4297	0.8305	0.4238
	HI 仅MPC	0.6393	0.4705	0.2821	0.6097	0.9959	0.5995
	CR srd‐MPC	0/29	0/22	1/25	2/25	2/21	0.0430
	CR tgt‐MPC	1/29	3/22	1/25	3/25	3/21	0.0947
	CR 仅MPC	4/29	3/22	1/25	4/25	4/21	0.1330
US‐101	vh (米/秒) srd‐MPC	10.1505	10.4960	10.2020	10.9406	9.7350	10.3048
	vh (米/秒) tgt‐MPC	10.3989	10.7071	10.5165	11.0393	9.8605	10.5045
	vh (米/秒) 仅MPC	10.6237	10.9072	10.6093	11.2079	9.8176	10.6331
	ah (米/秒²) srd‐MPC	1.1609	1.3325	1.0661	1.7717	1.4109	1.3484
	ah (米/秒²) tgt‐MPC	1.1632	1.6061	1.4135	1.8874	1.4795	1.5099
	ah (米/秒²) 仅MPC	1.4798	1.6183	1.4058	1.9159	1.7556	1.6351
	∆ah (米/秒³) srd‐MPC	0.1245	0.1526	0.1145	0.1787	0.1550	0.1451
	∆ah (米/秒³) tgt‐MPC	0.1320	0.1710	0.1511	0.1841	0.1619	0.1600
	∆ah (米/秒³) 仅MPC	0.1698	0.1730	0.1515	0.1827	0.1850	0.1724
	HI srd‐MPC	0.2664	0.3675	0.1517	1.0301	0.4928	0.4617
	HI tgt‐MPC	0.2865	0.8062	0.7836	1.2306	0.7578	0.7729
	HI 仅MPC	0.6062	0.8269	1.1758	1.3458	1.0394	0.9988
	CR srd‐MPC	2/35	2/28	1/40	6/31	2/36	0.0805
	CR tgt‐MPC	2/35	6/28	5/40	8/31	4/36	0.1531
	CR 仅MPC	4/35	6/28	8/40	8/31	6/36	0.1907

从测试数据中选取了两个详细示例，以说明提出的方法在图7和图8中的优势，其中真实数据来自数据集中的驾驶员操作。第一个示例是I‐80数据集中的一个切入场景，如图7所示。在此场景中，当目标车辆速度较慢并希望让行后方更快的跟随车辆时，发生了切入行为。如图7(d)所示，提出的方法在1.8 s时检测到目标车辆的变道意图，而目标车辆在7.3 s时跨越车道线，此时相对距离的突变如图 7(b)所示。若仅使用目标车辆信息，则变道意图直到6.6 s才被检测到。通过使用提出的方法，主车能够在切入发生前更早地实施减速干预控制，从而获得平滑加速度，并避免紧急制动。

另一个来自US‐101数据集的示例如图8所示。在此场景中，目标车辆试图并入主车车道以加速。提出的方法在 1.1秒时估计出切入行为，而目标车辆在8.2秒时跨越车道线。与上一个场景类似，在加加速度子图中可以看到更早且更平滑的控制。如果没有意图估计，由纯模型预测控制控制的主车由于突然切入而未能避免碰撞。

示意图5

示意图6

五、结论

本文提出了一种结合其他交通参与者变道行为估计的跟车控制方法。利用目标车辆及其周围车辆的多变量时间序列数据，构建了两个连续隐马尔可夫模型（HMM），分别表示变道行为和保持车道行为。采用基于阈值的分类方法对目标车辆的行为进行估计。同时，基于行为估计结果计算切入概率，并应用模型预测控制方法优化主车的跟车行为。该目标车辆行为模型的真正例率可达85%以上，且能在目标车辆跨越车道线前约4秒预测其变道行为。所提出的基于意图的模型预测控制在安全性和乘坐舒适性方面表现出更优的性能。

未来，我们将在更复杂的场景（如交叉路口）中研究基于意图预测的策略。复杂模型的解释也是一个研究方向。类似时间自动机的洞察模型将作为一种有前景的替代方案。

您可能感兴趣的与本文相关的镜像