自动驾驶变道个性化轨迹规划

原创于 2025-10-31 02:14:50 发布 · 381 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#自动驾驶 #个性化轨迹 #用户偏好 #变道控制 #FLPR #TOPSIS

部署运行你感兴趣的模型镜像

自动驾驶车道变换操作的个性化轨迹规划与控制

摘要

为了实现安全、智能和可持续的未来出行，本文提出了一种基于用户偏好的自动驾驶车辆变道个性化轨迹规划与控制方法。首先，采用约束Delaunay三角剖分识别变道过程中的安全区域。然后，结合B样条提出一种改进的快速探索随机树（ i‐RRT）算法，生成满足安全区域边界和车辆动力学约束的可行轨迹簇。为了从该轨迹簇中提取个性化轨迹，本文首先采用模糊语言偏好关系（FLPR）方法识别用户对驾驶的偏好，该偏好可通过驾驶安全、乘坐舒适性和车辆稳定性等主观目标体现。随后，利用逼近理想解排序法（TOPSIS）求解考虑用户偏好的多目标优化问题。上述算法被集成于一体，并在自动驾驶变道场景下进行了仿真和实验验证。仿真与实验结果表明，所提出的方法能够成功实现个性化轨迹规划与变道控制，在满足用户多样化偏好的同时确保车辆安全性，验证了其可行性与有效性。

Index Terms— 自动驾驶，个性化轨迹规划，用户偏好感知，变道，跟踪控制

I. 引言

DRIVING 是一项复杂的任务，包含连续的决策、规划和执行动作，以在既定的交通规则下避免碰撞，并最终实现出行目标。为了减少交通事故并提高交通系统的安全性与效率，得益于先进感知和计算技术的最新进展，自动驾驶车辆的发展得到了推动[1, 2]。变道是驾驶过程中的关键操作行为之一，并且是许多其他驾驶操作（如超车和掉头）的重要组成部分。因此，变道被视为评估自动驾驶汽车性能的一项重要操作。

自动驾驶车辆的安全性与智能化。并且被认为对交通运行效率[3],交通振荡[4]和交通容量[5]产生重大影响，因此已成为智能车辆领域的一个热门研究方向。

自动驾驶变道操作的现有研究可分为三个层次，即决策层、轨迹规划层和轨迹跟踪层[6]。在轨迹规划层中，自车需要根据安全性、动态性能等特定标准规划一条或多条可行轨迹，并从这些可行轨迹簇中确定一条最优轨迹。最后，轨迹跟踪层通过设计控制算法来执行具体操作动作，解决如何确保自车跟踪已规划的最优轨迹的问题[7]。许多方法被提出以提供无碰撞轨迹，这些方法考虑了车辆动力学、交通环境、障碍物信息甚至其他车辆的意图预测。这些方法可分为几类，包括基于几何的方法[8], 、数值优化方法和基于图的方法[9]。

基于几何的方法因其对计算需求简单且具有良好的合理性而广为人知。它包括杜宾曲线[10],贝塞尔曲线[11], 样条曲线[12]和多项式曲线[13]。基于数值优化的方法通过微分成本函数和约束[14]来寻找轨迹。车辆动力学限制、障碍物以及道路边界信息可以被表示为约束。通过求解该优化问题，可获得最优轨迹。然而，考虑复杂驾驶条件可能导致非凸优化问题，这在计算上难以求解[15]。快速探索随机树（RRT）是一种图搜索方法，由拉瓦勒提出，通过使用树结构对状态空间进行快速采样以寻找可行轨迹，是一种强大工具[16]。RRT的优点包括易于实现实时操作、能够概率性地探索大范围状态空间，以及处理通用动态模型的能力。这些优势使得RRT在路径规划中广受欢迎，同时也使其非常适用于局部规划[17]。

为了从轨迹候选集中找到最优轨迹，可以将代价函数与最短路径相关联行驶距离[18],最小燃油消耗[19],最小方向盘转角[20]或对用户而言最舒适或最平顺[21]。然而，基于单一准则（例如由Dijkstra算法生成的最短行驶距离）的路径选择可能无法反映现实世界中的路径选择决策，因此对用户而言并非理想选项[22]。关于上述现有研究，大多数轨迹规划方法未考虑用户或决策者的不同偏好的影响。惩罚机制已受到多个学科的广泛关注，不仅应用于自动驾驶道路车辆，也应用于飞机、地铁、火车及其他机器人领域。在轨迹规划中引入惩罚机制有助于提升驾驶体验，增强用户对自动驾驶功能的信任度，并满足其期望[23]。此外，每位用户的个人偏好可存储于其驾驶档案中，用于进一步监控其个性化驾驶风格与状态，避免因无关操作执行而打扰用户[24]。因此，从轨迹候选集中选择一个个性化选项以满足用户偏好，对于实现未来类人自动驾驶的发展具有重要意义和前景。

基于学习的方法在个性化轨迹规划研究领域变得越来越流行[25]。例如，文献[26]中的作者使用长短期记忆神经网络开发了一种数据驱动轨迹模型，用于生成类人驾驶轨迹。在[27],中，设计了一种带有二次逼近器的深度Q学习框架，以模拟人类驾驶员的车道变更决策过程。在[28], 中，提出了一种神经强化学习技术，以实现类人的纵向轨迹规划与控制。然而，模型训练需要大规模数据，这在实际应用中带来了许多限制。此外，这些方法未充分考虑驾驶员心理状态，无法在复杂动态环境中做出符合社会规范的高级别换道决策[29]。

基于上述内容，本文旨在提出一种基于用户偏好的自动驾驶车辆变道操作的个性化轨迹规划与控制新方法。采用结合约束Delaunay三角剖分（CDT）和B样条的改进 RRT生成可行轨迹规划候选。为了避免设计复杂的避障检查算法，我们首先构建一个安全区域，以确保由i‐RRT生成的所有轨迹候选均为无碰撞路径。该方法显著减少了寻找最优路径所需的计算时间和迭代次数，因而具备在现实世界中实现应用的潜力。在生成轨迹候选集合后，利用 TOPSIS算法选择考虑用户偏好的最优轨迹。采用模糊语言偏好关系（FLPR）方法以隐式方式收集用户偏好，通过比较其在预定义驾驶性能指标方面的期望来获取偏好信息。语言术语能够有效表达人类驾驶员的偏好，尤其是直觉偏好。一系列进行了仿真和实验测试，以验证所提出的方法的有效性和优越性。

论文其余部分结构如下。第二节总结了高层系统结构。第三节介绍了采用CDT和i‐RRT的轨迹规划模块。第四节阐述了用户偏好确定、个性化轨迹规划与跟踪控制器设计。第五节和第六节分别展示了仿真与实验验证。第七节对本文进行了总结。

示意图0

II. 高层系统架构

为了实现自动驾驶车辆在变道操作中的个性化轨迹规划与控制，需要开发多个子系统和组件。如图1所示，所提出的系统主要由两个子系统组成，即带有i‐RRT的个性化轨迹规划模块和轨迹跟踪控制模块。

轨迹规划子模块的主要目标是生成一条考虑无碰撞的最优轨迹通道道路边界障碍物边界 S!起始位置目标区域 F! 行驶方向 F! 自车道路中心线前导车辆目标车辆中的跟随车辆 (a) (b) (c) (d) (e) 自车前导车辆跟随车辆当前车道目标车道 Sp 自车前导车辆跟随车辆当前车道目标车道 a 距离 S p F p S p F p S p F p d f 当前车道内的前导车辆当前车道 d”缓冲距离 d s d s d s d#安全距离安全区域约束Delaunay三角剖分 (b) 图2：基于约束Delaunay三角剖分的无碰撞通道与安全区域示意图车辆动力学和用户期望。轨迹跟踪子系统的目标是利用模型预测控制（MPC）精确跟踪所选路径。在轨迹规划模块中，第一步是基于约束Delaunay三角剖分识别安全区域。考虑车辆宽度后，通过应用缓冲距离 df进一步缩小安全区域。随后，基于i‐RRT和车辆动力学生成一系列可行轨迹候选。第三步，设计一个识别系统，用于收集用户在驾驶方面的个性化目标，包括“驾驶安全”、“乘坐舒适性”和 “车辆稳定性”。通过使用模糊语言偏好关系（FLPR）方法，识别用户对上述指标的偏好，并用权重矩阵表示。最后，采用TOPSIS方法计算轨迹候选的排序，并最终为自动驾驶选择个性化最优轨迹。

III. 基于i‐RRT和CDT的安全轨迹规划

在本节中，我们开发了一种改进的RRT算法，即 i‐RRT，以生成安全的轨迹候选。与传统RRT算法相比，所提出的i‐RRT具有更高的收敛速率。首先，我们定义一个无碰撞通道作为i‐RRT进行探索的安全区域。随后在第三节‐ B中详细描述了i‐RRT算法的具体内容。

假设3.1：

假设自车配备了车载传感器，例如雷达、激光雷达、摄像头和GPS/INS装置，能够测量其位置、速度、加速度以及一定范围内的周围环境。因此，自车可以识别安全变道操作所需的间隙，并合理做出变道决策。

基于CDT的无碰撞通道

变道的无碰撞通道识别基于目标车道的选择，如图 2(a)所示。我们假设自车最初在右车道上行驶车道。根据交通规则，自车应变道至左车道进行超车。每辆车都显示为一个矩形。矩形的大小基于相应车辆的参数（即宽度和长度）。应注意，在目标车道前车的矩形中应用了安全距离。引入安全距离 ds是为了避免自车变道后发生追尾碰撞（见图2(b)）。

定义3.1：

无碰撞通道是一个简单多边形，包含变道操作的起始点和目标区域，与前导车辆保持安全距离，并由有限数量的相邻三角形序列组成。

根据定义3.1，在车道变换过程中，经过合理的决策后，总存在一个从自车当前位置开始，到目标车道前车矩形区域后边界结束的无碰撞通道（如图2(d)中浅绿色区域所示）。

假设3.2：

行驶区域可被离散化为N个约束Delaunay三角形。起点 S p位于三角形 Ts ∈ T, 1 ≤ s ≤ N中，最终区域 F p 位于三角形 T f ∈ T, 1 ≤ f ≤ N中。从S p 到 F p 的通道是一系列三角形 P=(t1, t2, · · ·, tn) ∈T × T × · · · × T, T={T1, T2, · · ·, TN}（其中 t1= Ts且tn= T f ），使得 ti与 ti+1在 1 ≤ i< n时相邻。

生成无碰撞通道的步骤总结见表I。

表I：生成安全区域的算法
1. 确定起始点 Sp 和目标区域 Fp ，并将行驶区域离散化为 N个受约束的Delaunay三角形；2. 找到起始点 Sp 所在的三角形 Ts ∈ T, 1 ≤ s ≤ N, T={T1 , T 2 , · · ·, T N}以及终点所在的三角形 T f ∈ T, 1 ≤ f ≤ N f 6= s F p ,。3. 构建邻接矩阵 D N × N 以表示任意两个三角形之间的关系。D(i, j) = 1 表示三角形 Ti = 0 4 T j i j T s 彼此相邻。否则，D(,)。从开始，基于矩阵 D，搜索与 Ts 相邻的三角形，重复此过程直到找到 T f 。

表I：生成安全区域的算法

1. 确定起始点 Sp 和目标区域 Fp ，并将行驶区域离散化为 N个受约束的Delaunay三角形；2. 找到起始点 Sp 所在的三角形 Ts ∈ T, 1 ≤ s ≤ N, T={T1 , T 2 , · · ·, T N}以及终点所在的三角形 T f ∈ T, 1 ≤ f ≤ N f 6= s F p ,。3. 构建邻接矩阵 D N × N 以表示任意两个三角形之间的关系。D(i, j) = 1 表示三角形 Ti = 0 4 T j i j T s 彼此相邻。否则，D(,)。从开始，基于矩阵 D，搜索与 Ts 相邻的三角形，重复此过程直到找到 T f 。

在识别出无碰撞通道后，获取该通道的边界并将其视为不可逾越的道路边界。通过考虑车辆宽度，并避免生成的路径过于接近通道边界的情况，需要在识别出无碰撞通道后缩小通道，即 ylow= ylow+ df yup= yup − df (1) 其中 ylow 和 yup 分别表示无碰撞通道的下边界和上边界， ds 是如图2(e)所示的安全距离。更多细节见 [30]。

B. 基于i-RRT与B-脊线的轨迹候选生成

在本节中，我们研究i‐RRT以生成一系列考虑自车动力学的轨迹候选。

1) 车辆动力学模型：

在本节中，描述了一个具有三自由度的动态车辆模型。状态变量为 x=[x⊕, y⊕, ψ, vx, vy, r]。 (x⊕, y⊕)分别为车辆坐标系(X, Y)中的纵向和横向位置。 vx 和 vy分别表示质心(CM)在惯性坐标系(x, y)中的纵向和横向速度。˙r= ψ为横摆率， ψ为惯性航向角。车辆的动力学由以下微分方程组建模： v˙x= rvy − 2 m(Fcf sinδf − Tr/Rw), v˙y= −rvx+ 2 m(Fcf cosδf+ Fcr), r˙= 2 Iz (lfFcf − lrFcr), x˙⊕= vx cosψ − v y sinψ, y˙ ⊕= vx sinψ+ v y cosψ. (2) 其中， m和 Iz分别表示车辆的质量m和横摆转动惯量。 l f和 lr分别表示车辆质心到前轴和后轴的距离。 Rw为滚动半径。 Fcf 和 Fcr分别表示前轮和后轮的侧向轮胎力。 Fci, (i ∈{f, r}) 可通过Fci= −Cαiαi,(i ∈{f, r}) 计算得到，其中 Cαi(i= f, r) 表示前轮胎和后轮胎的刚度系数。 αi( i= f, r) 表示轮胎滑移角，可表示为 αf ≈ v y +l f r v x − δ f 和 α r ≈ v y −l r r v x 。然后，我们可以得到以下车辆动力学的紧凑形式： x˙(t)= f(x(t), u(t)). (3) 其中系统的输入信号为前轮转角 δ f 和后轮驱动力矩或刹车扭矩 T r ，即 u=[δa T r] T。

2) 带B样条的改进型RRT：

在本节中，我们开发了一种改进型RRT以生成一系列无碰撞轨迹候选，同时使用B样条进一步平滑生成的轨迹。RRT是一种用于寻找可行轨迹的强大工具在复杂动态环境中。以自车的初始位置作为根节点，逐步生长出一棵树，直到该树到达目标位置。根据第三节‐A确定无碰撞环境和起始点。将自车的方向作为 x轴的正方向。变道过程完成后，自车的航向角满足 ψ(end) ≈ 0。基于 [16]和所建立的车辆动力学模型(3)，所提算法在表二中进行了描述。

表二：生成安全变道轨迹候选的算法
1. 用自车的初始位置 Sp、初始航向角ψ(0)、初始车辆状态[vx( 0) vy(0) r(0)]以及初始控制动作[δf(0) Tr(0)]T初始化一个快速探索随机树。 2. 在安全区域中构建以初始位置 Sp为根节点、且有一定数量顶点落在目标区域 Fp附近的快速探索随机树。 3. 基于快速探索随机树生成一条轨迹候选，并验证是否满足 ψ(end) ≈ 0。 4. 重复上述步骤，直到识别出 N条不同的轨迹候选。 5. 使用B样条对生成的轨迹候选进行平滑处理。

表二：生成安全变道轨迹候选的算法

1. 用自车的初始位置 Sp、初始航向角ψ(0)、初始车辆状态[vx( 0) vy(0) r(0)]以及初始控制动作[δf(0) Tr(0)]T初始化一个快速探索随机树。 2. 在安全区域中构建以初始位置 Sp为根节点、且有一定数量顶点落在目标区域 Fp附近的快速探索随机树。 3. 基于快速探索随机树生成一条轨迹候选，并验证是否满足 ψ(end) ≈ 0。 4. 重复上述步骤，直到识别出 N条不同的轨迹候选。 5. 使用B样条对生成的轨迹候选进行平滑处理。

所提算法能够保证树在生成的安全区域内生长，而不是在整个导航环境中生长。这样就无需进行碰撞检测步骤，从而显著提高了计算效率。B样条是用于平滑路径的有力工具。B样条方程如下所示 p(h)= m ∑ i=0 diNi,k(h) (4) 其中 di(i= 0, 1, 2, · · ·, n) 表示特定轨迹候选的路径点。Ni,k (h) 是减量参数 h 的函数，可用科克斯‐德布尔方程表示： Ni,0(h)=®1, if hi ≤ h ≤ hi+1 0, others Ni,k= h−h u i+k −u i Ni,k−1+ h i+k+1 −h h i+k+1 −h i+1 Ni+1,k−1(h) (5) 其中 h0 ≤ h1 ≤ · · · ≤ un+k+1 和 0 0 == 0。 k 是 B样条阶数。更多细节请参见 [31]。

3) 基于带B样条的改进型RRT的动态重规划：

所提算法可通过考虑周围车辆的行为，在动态驾驶环境中轻松扩展。当变道操作的安全性得到保障时，ego车辆可直接跟踪所设计的个性化轨迹。个性化轨迹可通过向更新后的目标位置延伸，并经由一系列新节点进行更新。一旦变道操作被评估为不安全，则将做出保持车道决策，ego车辆将执行车道保持操作，直至变道操作的安全性和可行性条件均满足为止。随后触发变道轨迹重规划过程，并为ego车辆生成新的个性化轨迹以供跟踪。上述过程主要包括四个阶段：轨迹生成（见第三节.B）、轨迹跟踪、变道操作的安全性和可行性评估，以及车道保持决策。为了评估变道操作的安全性，我们使用恒定转弯率与加速度（CTRA）模型[32]在预测时域(2s)内预测每辆车的位置。我们将自车预测位置的三角形与跟随者和领航者位置的三角形的交集作为评估指标。如果任意一对三角形发生重叠（交集 6= ∅），则做出保持车道的决策。在车道保持模式下，我们使用PID控制器使自车保持在其当前车道，并根据前车的状态控制其速度。变道操作的可行性评估结合安全性评估被设计并用于做出变道决策。可行性评估与前导临界间隙相关。前导临界间隙的计算公式为 Gl= exp( ηl+ κl∆vel+ βl)。∆vel是自车与新定义的领航者车辆之间的相对速度。 ηl和 κl是设计参数，分别设为0.1和0.4。 βl是一个随机项，满足：βl： N(0, σ2 lead)，其中 σlead= 0.74。更多关于前导临界间隙的细节可参见[33]。当实际前导间隙大于前导临界间隙时，变道操作的可行性得以保证。结合安全性评估，做出变道决策，并生成一条新的个性化变道轨迹。上述步骤可能重复执行，直到完成变道任务。综上所述，动态轨迹规划的伪代码总结于算法 1中。

算法1：动态个性化轨迹规划
输入：变道决策
1 初始化：通过个性化轨迹生成提出的i‐RRT算法（表II）；
2 当变道驾驶任务未完成时执行
3 if变道操作的安全性得到满足&决策进行车道变更（模式1）然后
4 进行轨迹跟踪；
5 更新个性化轨迹；
6 else if变道操作的安全性不满足 || 车道保持的决策（模式2）然后
7 车道保持（LK）的决策；
8 执行车道保持
9 else if车道变更的安全性得到满足&决策在车道变更上then
10 如果车道变更的可行性得到满足（模式3）则
11 车道变更决策 ;
12 个性化轨迹生成
13 结束

个性化轨迹的选择将在下一部分中描述。

IV. 个性化轨迹选择与跟踪算法

在本节中，首先设计了一个用户偏好感知系统，用于识别用户在出性方面的个性化目标。然后基于TOPSIS方法（第四节‐B）选择最优轨迹。采用基于模型预测控制的跟踪控制器使自车跟踪所选轨迹（第四节‐C）。

A. 用户偏好感知系统

首先，我们定义个性化目标，用户偏好基于这些目标而形成。考虑到用户对设计指标的判断具有模糊性，需要构建权重矩阵。本文中，用户对一组准则的偏好以模糊语言方式表示，这种方式在自动驾驶中具有良好的应用前景和实用性。该方法收集用户偏好的具体步骤总结于图3，并在下方进行描述。

示意图1

1) 个性化目标定义：

基于对人类自然驾驶数据的分析，人类驾驶过程中的操作目标主要可分为三类：驾驶安全（C1）、乘坐舒适性（C2）和车辆稳定性（C3）。我们将详细解释每个指标：

1) 驾驶安全。对于某一轨迹候选 pj ={(xj,0, yj,0) · · ·,(xj, m j , yj ,m j)} ，其中 m j + 1表示该轨迹候选 pj ∈{1, · · ·, N}的路径点数量（包含起点），我们通过计算该轨迹与安全区域边界的距离来评估 pj 的安全性水平： c 1 j = 1 m j +1 m j ∑ i=1 1 min(d¯(yj ,i , ylow,i) , d¯(yj ,i , yup ,i)) (6) ¯其中 d(A, B) 是 A 和B 之间的欧几里得距离。 ylow,i 和 yup ,i 分别是 yj ,i 的下界和上界。

2) 乘坐舒适性。对于车辆横向控制，期望实现“平滑”的运动。而急剧或频繁操纵方向盘的转动会影响轨迹的平滑性，从而降低乘坐舒适性。这里我们使用以下方程来评估轨迹对应的乘坐舒适性： c2j= 1 mj+ 1 mj ∑ i=0 φj i−1,i (7) 其中φj i−1,i是轨迹候选 pj中两个相邻路径点之间的航向角差。

3) 车辆稳定性。对于给定的轨迹，横摆率、侧滑角和位置跟踪的控制性能可以表征车辆稳定性，可表示为 c3j= a1 mj ∑ i=0 ‖rj i,ref − rj i‖+ a2 mj ∑ i=0 ‖βj i ‖ + a3 mj ∑ i=0 »(xj,i − xj⊕,i) 2+(yj,i − y⊕ j,i) 2 (8) 其中(x ⊕ j i,,y ⊕ j i,)是相对于pj的实际轨迹。 rj和 βj分别为实际横摆率和侧滑角，分别对车辆稳定性与车辆操纵性具有重要影响。 β可通过 β= arctan(vy vx)获得。 rj i,ref是相对于 pj的参考横摆率。期望横摆率被确定为车辆速度 vx和前轮转角 δf[34]的函数： rref= vx lf+ lr+ kuvx δf ku= m(lrCαr − lfCαf) (lf + lr)CαfCαr (9) a1、a2和 a3是权重系数。

2) 语言变量的确定：

在本研究中，通过使用FLPR方法，用户能够通过引入语言变量而非数值评分，以语言术语表达其偏好。相关定义如下所示：

定义 4.1： 一个模糊集 A由一个隶属函数 µA(x)定义，该函数表示元素 x对集合 A的隶属程度： µ A(x) : X→[0, 1]。 µ A(x) 的值越高， x 属于集合 A 的程度就越高。

定义 4.2： [35] A 是一个模糊数，如果 A 是正规模糊且凸的，且 µA(x) 是分段连续的，本文采用三角模糊数表示法。此处，我们使用七个基本语言术语来表达用户对驾驶性能的偏好：“绝对（不）重要”、“强（不）重要”、“弱（不）重要”和“同等重要”，这些术语相对于定义的三角模糊数（TFN）而言。

定义 4.3： 三角模糊数 A˜=(al, am, ar) 是具有隶属函数的模糊数 µA(x)=  x−al am−al, x ∈[al, am], ar−x ar−am, x ∈[am, ar] 0, x< al and x> ar 其中 al, ar ∈ R分别为模糊数的下界和上界。 am是满足 al< am< ar的中间值。

备注 4.1： 需要注意的是，在实际应用中，这些语言变量可以通过多种方式传递给人类乘客。例如，可以通过乘员前方的触摸屏显示，供他们进行成对比较，或者通过人类与人工智能之间的基于听觉的对话交互来表达。然而，由于人机界面的具体设计并非本工作的主要议题，因此将不详细讨论向人类用户传递语言变量的详细实践方法。

语言评估变量对应的三角模糊数列于表III中。

表III：模糊语言评估变量
语言变量
绝对不重要 (AN)
强烈不重要 (SN)
弱不重要 (WN)
同等重要（EI）
较弱重要（WI）
强重要（SI）
绝对重要（AI）

IV. 个性化轨迹选择与跟踪算法（续）

3) 模糊语言偏好关系：

给定一组备选方案（轨迹候选），我们构建一个模糊语言偏好关系矩阵P，其元素为 p˜ij =(p l ij , p m ij ,p r ij) i, j ∈{1, · · ·, n}。 p l ij 、 p m ij 和 p r ij 分别表示模糊数 p˜ijs的下界、中位值和上界。根据一致性模糊偏好关系理论，以下陈述是等价的[36]： p l ij + p r jr = 1, ∀i, j ∈{1, · · ·, n} (10a) p m i j + p m j i = 1, ∀i, j ∈{1, · · ·, n} (10b) p r i j + p l j r = 1, ∀i, j ∈{1, · · ·, n} (10c) p l i j + p l jq + p r q i = 1.5, ∀i< j< q (10d) p r i j + p l jq + p l q i = 1.5, ∀i< j< q (10e) p m i j + p m jq + p m q i = 1.5, ∀i< j< q (10f) p l i(i +1 ) + · · ·+ p l (j − 1 )i + p l (j − 1 )i = j − i+1 2 , ∀i< j (10g) p m i ( i+1 ) + · · ·+ p m (j − 1 ) i + p m (j − 1 ) i = j − i+1 2 , ∀i< j (10h) p r i ( i+1 ) + · · ·+ p r (j − 1 ) i + p r (j − 1 ) i = j − i+1 2 , ∀i< j (10i)

注释4.2： 需要注意的是，如果元素 p˜ij ∈P位于区间 [−s, 1+ s] (s> 0) 内而不是 [0, 1],，则所得到的模糊数 p˜ij,(i, j= 1, · · ·, n) 需要通过以下变换函数 f 进行变换：[−s, 1+ s]→[0, 1]： f(−s)= 0, f(1+ s)= 1 (11a) f(xl)= xl+ s 1+ 2s (11b) f(xm)= xm+ s 1+ 2s (11c) f(xr)= xr+ s 1+ 2s (11d)

4) 客观权重的确定：

对于一个其元素属于区间[0, 1], 的模糊语言偏好关系矩阵P，通过模糊语言平均算子和各目标的模糊权重来计算 v˜i= 1 n(p˜i1 ⊕· · · ⊕ p˜ij ⊕· · · ⊕ p˜in) w˜i= v˜i ⊗[v˜1 ⊕· · · ⊕ v˜i ⊕· · · v˜n]−1 (12) 其中， p˜ij是维度 i相对于目标 j的模糊比较值。 v˜i是目标 i和 w˜i=的模糊语言平均算子，(wl i, w m i, wr i) 是第 i个目标的模糊权重。 ⊕、 ⊗和()−1为模糊算子。通过公式 (12)的计算，目标权重 w˜i以模糊数(wl i, w m i, wr i)表示，其中 wl i、 wm i和 wr i分别代表第i个目标模糊权重的下限、中间和上限值。为了获得模糊权重 w˜i的精确值，需要采用去模糊化方法。在本文中，我们使用面积重心(COA)法对模糊权重进行去模糊化： wi= COA(w ˜i)= wl i+2wm i+ wr 4 , ∀i (13)

B. 基于TOPSIS的最优轨迹选择

TOPSIS 是一种最有用的多准则决策方法，可用于选择最优选项。当准则和备选方案数量较多时，它能够降低计算负担，并能够在决策过程中捕捉不确定性和模糊性 [37]。 TOPSIS的基本原理是最优轨迹应距离负理想解最远且距离正理想解最近。基于第四节‐A2部分定义的个性化目标以及第四节‐A4部分计算出的权重，TOPSIS的步骤可描述如下：步骤1：基于 N个轨迹候选和 n= 3个属性（驾驶安全、乘坐舒适性和车辆稳定性）构建评估矩阵H N ∗ n =(hi j) m×n。由于 C 1需最大化，而 C 2和 C 3需最小化， H(N,1) = C T 1 ，H(N,2) = 1/C T 2 和H(N,3) = 1/C T 3 。步骤2；从第四节‐A4部分确定目标权重W=(wj) 1×n 。 Step 3: Normalize matrix H and get R=(rij)m×n, rij= hij √∑mk=1 h 2 kj . Calculate the weighted normalised deci-sion matrix T=(tij)= rij · wj, i= 1, 2, · · ·, m, j= 1, · · ·, n. 步骤4：确定替代方案 i与最佳条件 H+之间的目标距离 di。 d+i= Ã n ∑ j=1 (tij − t+j)2, H+={(max i tij|j ∈ J+),(min i tij|j ∈ J?)} ={t+j |j= 1, 2, · · ·, n} (14) 其中 J+={j= 1, 2, · · ·, n|j}是一个具有正向属性的集确合定。替代方案 i与最恶劣条件 H−之间的目标距离 di− ： di−= Ã n ∑ j=1 (tij − t− j)2, H−={(min i tij|j ∈ J+),(max i tij|j ∈ J−)} ={t− j |j= 1, 2, · · ·, n} (15) 其中 J−={j= 1, 2, · · ·, n|j}是一个具有正向属性的集合。步骤5：根据以下方程计算系数 E? i： E? i= J− i J− i+ Ji+ , 0 ≤ E? ≤ 1 (16) 步骤6：根据 E? i对备选方案排序，并将最优的一个 p ?作为个性化最优轨迹。

C. 基于模型预测控制（MPC）的控制器设计用于轨迹跟踪

在本节中，设计了一种MPC控制器用于对个性化轨迹进行高精度跟踪。该优化问题建立如下： min U t ,ε H p ∑ k=1 {‖yt+k,t −p ? t+k‖ 2 R + ‖vt+k,t − v ?‖2H}+ H c ∑ k=1 ‖∆ut+k,t‖ 2 Q (17a) s.t. xt+k+1,t= f d (xt+k,t, ut+k,t), k= 0, · · ·, H p − 1 (17b) yt+k,t =ï1 0 0 0 0 0 0 1 0 0 0 0 ò xt+k,t (17c) u t+k,t = ∆u t+k,t + u t+k − 1,t (17d) u min ≤ u t+k,t ≤ u max , k= 0, · · ·, H c − 1 (17e) ∆u min ≤ ∆u t+k,t ≤ ∆u max , k= 0, · · ·, H c − 1(17f) ∆u t+k,t = 0, k= H c , · · ·, H p (17g) u t − 1,t = u(t − 1) (17h) x t,t = x(t) (17i)

示意图2

其中 fd是式(3)在固定采样时间 Tp下的离散化系统模型。 t表示当前时间步，xt+k,t表示通过对系统xk+1= fd(xk, uk) 施加控制序列 Ut=[ut,t, · · ·, ut+k,t]得到的在时间 t+ k 的预测状态，其中xt,t= x(t)。 Q、 H和 R分别是跟踪误差和控制动作的权重系数。 Hc为控制时域，而 Hp为预测时域，且满足Hp ≥ Hc。 p?t+k=[x?t+k yt?+k]T是优化问题中的参考信号。 v?是leader车辆的速度。该优化问题具有三个目标：第一项用于最小化实际位置(x⊕, y⊕)与第三节生成的个性化轨迹(x?, y?)之间的跟踪误差；第二项旨在减小自车车辆与领航者车辆之间的相对速度；第三项反映了对∆ut+k,t大小的考虑。控制输入为 u=[δf, Tb]。控制输入及其导数受到车辆物理特性的限制，即 umin ≤ u ≤ umax和 ∆umin ≤ u ≤∆umax。 umin、 umax、 ∆umin和 ∆umax分别表示饱和水平。上述优化问题可通过f mincon在MATLAB仿真环境中有效求解。

五、仿真测试

在本节中，我们进行了一系列仿真，旨在回答以下研究问题：研究问题1：所提出的方法能否为自动驾驶车辆提供个性化轨迹规划？研究问题2：所提出的方法能带来哪些好处？研究问题1 用于验证所提出的个性化轨迹规划与跟踪方法的总体性能。研究问题2 旨在探究所提出方法的优越性。

A. 仿真场景

仿真实验场景设置如下： 1) 驾驶场景为双车道高速公路。道路宽度为3.5m。最小安全距离为 d s = 3m ，缓冲距离为 d f = 0.5m。 2) 自车从起始位置(0,0)开始行驶，初始速度为(vx( 0) = 10m/s)。 3) 前轮转角被限制在 −35 ∼ 35度以内。超出该范围的输入角度将无法由车辆执行。制动扭矩被限制在[160 250] (N · m)范围内。 4) 控制动作变化的限制设置为 −20 × π 180 ≤∆a ≤ 20 × π 180 −20 ≤Tb ≤ 20 5) 采样时间是 0.1s。控制时域为 Hc= 1，而预测时域为 Hp= 2。

B. 仿真结果

1) 研究问题1：所提出的方法能否为自动驾驶车辆提供个性化轨迹规划？：

我们基于驾驶环境和车辆信息识别安全区域。然后，基于带B样条的<i‐RRT生成40个可行轨迹候选。图4展示了这些可行轨迹候选，表明在已识别的安全区域内无碰撞的通道为生成安全的轨迹候选提供了可行空间。采用方法结合车辆动力学生成一组可行轨迹。为了选择一条个性化轨迹，我们设定三位用户分别根据表 III表达其偏好。用户1对应的两两比较矩阵列于表IV中。

表IV：针对用户1的三个准则的两两比较
用户1
C1
C2
C3

根据表IV可以看出，只需要进行 n − 1= 2比较判断（p12,p23），其他元素可通过(10)获得。关于用户1的三个主要目标的模糊语言偏好关系决策矩阵列于表VII。

表V：三个目标的模糊语言偏好关系决策矩阵
用户1
C 1
C 2
C 3

由于上述矩阵中存在元素不在区间[0, 1],内，我们使用注释4.2中定义的变换函数，得到表VI所示的矩阵。根据(13)，可以计算目标权重 W=[0.5, 0.23, 0.22] 通过在TOPSIS算法中实施上述客观权重，计算并展示了个性化轨迹

表VI：矩阵的变换结果
用户1
C1
C2
C3

如图5(a)所示。跟踪性能如图5(b)所示。根据表IV可知，用户1比乘坐舒适性和车辆稳定性更关注驾驶安全。自车的选定轨迹由红色虚线表示，如图5(a)所示。当自车沿该轨迹行驶时，不会与其他车辆发生碰撞，也不会靠近边界。此外，与轨迹簇中的其他候选轨迹相比，自车在每一点上的位置均处于相对安全的状态，距离安全区域的边界较远。然而，由于用户1不太关心动态性能，因此所选轨迹在转向行为上的变化范围较小（见图5(b)）。

相比之下，根据表VII，驾驶安全性和动态性能是用户 2最重要的两个指标。用户2的客观权重可以计算为 W=[0.37, 0.50, 0.24] 与用户1生成的轨迹相比，该

表VII：关于user2的三个目标之间的成对比较
用户2
C1
C2
C3

用户2的个性化轨迹（蓝色虚线）通过在一定程度上放宽轨迹的安全约束而变得更加平滑。车辆相应的跟踪性能如图 5(c)所示，具有更小的跟踪误差。

最后，用户3对变道过程中车辆的操控能力表现出极大关注，包括跟踪性能、车辆稳定性和车辆操纵性。表VIII 列出了两两比较矩阵，用户3的目标权重如下所示 W=[0.18, 0.33, 0.49] 用户3的轨迹规划与选择测试结果如图6(a)所示。该个性化轨迹比上述两条轨迹更加激进，因为此轨迹非常接近安全区域的边界限制，同时也符合用户的偏好。图 6(b)‐(d)表明自车能够准确跟踪其个性化轨迹，并且车辆的整体稳定性也得到了保持。

示意图3

示意图4

仿真结果表明，在变道操作过程中，用户的个性化目标能够成功地反映在自动驾驶汽车的规划轨迹中，验证了所提出方法的可行性与有效性。同时，通过使用模糊语言术语，用户偏好可以被高效表达。此外，用户的选择还取决于模糊语言评估变量的数量。随着评估变量数量的增加，个性化目标能够被更准确地表达。用户偏好可初始设置为默认值，并在行驶过程中根据需要进行调整。一旦获得新的两两比较矩阵，目标权重即可更新，生成新的个性化模式。此外，结果还表明计算时间与轨迹候选数量之间存在权衡关系。轨迹候选越可行，RRT算法所需的计算时间越多，用户可获得的选择也越多。

为了展示所提出的方法在动态驾驶环境中的有效性，考虑了跟随者车辆（vf0= 10.5m/s, af= 3m/s2）和领航者车辆（vl0= 12m/s, al= 3m/s2）的动态行为。其中，跟随者车辆的行为较为激进，加速前进，限制了自车进行变道操作。仿真结果如图7所示。结果表明，无碰撞通道能够根据驾驶环境的信息被识别并实时更新。在时间步 k= 1 生成了一条初始个性化轨迹，自车沿该轨迹行驶至 k= 11 （图7b）。当安全约束被违反时，自车开始执行车道保持操作。当变道操作的安全性和可行性再次满足时（k= 64），系统重新规划出一条可行的变道轨迹，自车随后跟踪新的轨迹以完成驾驶任务。整体行驶路径如图7d所示。为了展示所提出的 iRRT算法的实时能力，各时间步的计算时间如图8所示。结果显示，每一步的平均计算时间为 0.0242s0.1s，能够满足实时应用需求。此外，在变道操作开始阶段以及变道操作重新启动阶段，算法的计算时间相对较长。这是因为在这些时间段内， i‐RRT树除根节点外没有可行节点，导致RRT树的生长过程较为耗时。在后续步骤中，新树基于上一循环旧树的剪枝与重生长反复生成，该过程可提高计算效率，从而导致计算时间下降。计算时间较短。还应注意， i‐RRT 的增长与树节点的数量限制以及自车与障碍车辆之间的相对位置有关。数量限制的减少或自车与领航者之间相对位置的减小，均可导致更短的计算时间。所提算法在计算时间方面的改进及其实时实现将在未来进一步研究。

示意图5

示意图6

2) 研究问题2：我们的方法能带来什么好处？：

所提出的方法的好处被进一步探讨。我们设定了用户4的两两比较矩阵，如表IX所示。根据表IX，三个目标同等重要，相应的权重是 W=[0.41, 0.42, 0.44]

表IX：关于用户4的三个目标的两两比较矩阵
用户4
C1
C2
C3

我们评估了每位用户个性化轨迹的性能，比较结果如表X所示。

表X：性能评估与比较
评估
用户4 (默认)
用户1
用户2
用户3

表X中列出的结果表明，所提出的方法能够选择最符合用户偏好的特定轨迹。该方法可以生成反映用户偏好的可行轨迹，并通过预定义的指标为用户提供更多个性化自动驾驶定制的自由度。为了进一步验证所提出方法的有效性，下一节将介绍基于驾驶模拟器的评估研究。

六、实验验证

在本节中，通过实时实验进一步验证了所提出方法的有效性。

A. 实验设计

实验在如图9a所示的驾驶员在环驾驶模拟器上进行。该平台由一台配备NVIDIA GTX 2080 Super GPU的计算机、三台拼接式抬头显示器、Logitech G29 赛车方向盘套装以及驾驶员座椅组成。实验中，驾驶课程设置为一条具有两条车道的直线城市道路，如图9b所示。要求参与者首先沿直线以恒定速度行驶，然后在车辆通过指定点后执行变道操作。所有参与者应尽量在给定的终点前完成变道。驾驶员的输入通过方向盘转角、刹车和油门踏板位置进行测量。车辆的状态，包括纵向和横向加速度、速度以及位置，均被记录下来。共有5名人类参与者（平均年龄26岁）参与了该实验。所有参与者均有驾驶经验。实验前，要求所有参与者对上述指标进行成对比较，并详细介绍了每个指标，以确保参与者主观期望与其实际操作的一致性。所有参与者首先被允许进行练习，以熟悉模拟器操作。随后，每位参与者被要求完成10次实验。每次实验中，参与者需在同一驾驶场景下连续执行10次变道操作。每位参与者平均驾驶30分钟。

B. 性能评估指标

这里引入相似性函数LCSS来评估所提出的方法[38]的有效性：定义6.1：给定 ε，两条轨迹 A={a1, · · ·, an}和 B={b1, · · ·, bm}之间的相似性函数 SF定义为 SF(ε, A, B)= LCSSδ,ε(A, B) min(n, m) (18) 其中 LCSSε(A, B)= 0, if A or B is empty 1+LCSSε(ai− 1 , b j − 1), dist(ai , b j) < ε max(LCSSε(ai − 1 , b j) , LCSS δ,ε(ai , b j − 1)), Otherwise i= 1, · · ·, n, j= 1, · · ·, m 其中 dist(ai , b j) = √(xi − x j) 2 +(yi − y j) 2 表示两点 ai (ai , b j) 和 b j( x j , y j) 之间的距离。 ε 是匹配阈值。 SF 的取值范围为 0 到 1，其中 1 表示两条轨迹完全重叠，而 0 表示两条轨迹完全不同。

示意图7 一个人在环驾驶模拟器；(b) 驾驶课程的一个示例 se)

示意图8

C. 实验结果

图10展示了每位参与者的变道路径。每条粗虚线代表每位参与者在去除失败变道操作数据后的“平均”变道路径。实验中的一个有趣发现是，驱动因素4和驱动因素5具有相似的偏好，并且确实执行了相似的变道路径。此外，所提出的方法为驱动因素4和驱动因素5选择了相同的个性化路径（9th）（见表XI）。这反映出驾驶员的行为符合其个人感受和偏好。此外，通过改进的i‐RRT结合B样条生成并展示了80个轨迹候选。可以看出，这些轨迹候选能够描述所有参与者可能的各种性能表现。

表XI: 实验性能评估与比较
参数.偏好
驱动因素 1 ( SI,WN )
驱动因素 2 ( WM,SI )
驱动因素 3 ( WN,WI )
驱动因素 4 (人工智能,WN)
驱动因素 5 ( 人工智能,工程索引 )
平均

实验结果总结在表XI中。结果表明，尽管驾驶员的主观期望与实际行为之间可能存在差距，所提出的方法仍能从轨迹候选簇中选择出与驾驶员偏好高度匹配的轨迹候选。需要注意的是，轨迹候选的数量取决于具体的驾驶任务、驾驶员的驾驶技能以及计算效率。

第七节结论

为实现个性化智能出行，本文研究了一种针对自动驾驶车辆变道操作的个性化轨迹规划与控制新方法。为了在保证车辆安全的同时生成可行路径，我们提出了一种识别安全区域的方法，可在该区域内生成可行轨迹。在无碰撞区域中，采用改进的带B样条的RRT方法生成可行轨迹候选集。为高效获取用户对驾驶的偏好，采用模糊语言偏好关系方法（FLPR方法）识别其在驾驶安全性、乘坐舒适性和车辆稳定性方面的个性化目标。随后，将该问题建模为多目标优化问题，并利用TOPSIS算法根据用户偏好确定个性化轨迹。最后，设计了MPC控制器以实现高精度轨迹跟踪，完成变道操作。所提算法在不同用户偏好设置下的自动驾驶变道场景中进行了集成与测试。仿真与实验测试结果表明，所生成的轨迹能够适应动态驾驶环境中用户的多样化需求，同时确保车辆安全性。

您可能感兴趣的与本文相关的镜像