基于HSIC的车道保持方法

一种基于人模拟智能控制的新型车道保持方法

摘要

本文提出了一种基于人类模拟智能控制(HSIC)的自动驾驶车辆车道保持新方法,该方法受人类专家驾驶员转向特性启发,包括良好的预见性、精确执行和显著的间歇性。本文的创新之处在于将HSIC概念引入车辆横向控制,该控制方案是一种多模式控制方案,通过曲线跟踪的前馈控制与用于间歇性误差校正的执行‐等待控制相结合实现。理论上,基于切换系统相关方法对HSIC方法的稳定性问题进行了研究。在PreScan与CarSim联合仿真平台上的实验表明,所提出的HSIC方案相较于专家驾驶员具有更好的匹配性能和良好的鲁棒性。对于自动驾驶车道保持系统而言,HSIC方法可提供类人特性,这可能是决定驾驶员在移交转向权限时是否感到舒适的关键因素之一,有助于提升人车协同驾驶场景下的过渡平顺性,并消除未来混合交通流中手动驾驶车辆与自动驾驶车辆之间的潜在冲突。

索引词

人模拟智能控制,车道保持,执行与等待,驾驶员行为建模,人车协同驾驶。

I. 引言

INTELLIGENT 和自动技术极大地改变了汽车工业,其最终目标是完全用机器智能取代人类驾驶员,这可以分为两条主要技术路线:第一条是通过集成计算机、通信和控制技术来构建先进的自动驾驶车辆;第二条是通过向专家级人类驾驶员学习,创建基于计算机“驾驶大脑”的自主轮式机器人。对于车道保持这一相对简单且常见的驾驶任务而言,车道保持辅助(LKA)系统是最常见的[1]。

稿件于2020年2月22日收到;2020年10月30日修订;2021年3月11日接受。本工作部分由国家重点研发计划项目编号2016YFB0100904资助,部分由重庆市自然科学基金项目编号cstc2017jcyjBX0001资助,部分由国家自然科学基金项目编号61803052资助。本文的副编辑为L. 李。

(通讯作者:孙迪华。)作者单位:中国重庆重庆大学自动化学院,邮编 400044,以及教育部物理信息社会可信服务计算重点实验室,重庆大学,中国重庆,邮编400044(电子邮件:chenjinjiayou271@126.com; d3sun@163.com;min992215@163.com;uply@ cqu.edu.cn; liu.z.c@cqu.edu.cn)。数字对象标识符 10.1109/TITS.2021.3066586

自动驾驶车辆的横向控制功能,可通过高频计算和操作结合高精度传感器(摄像头和雷达)以及高性能计算平台,使车辆保持在车道中央。然而,从车辆横向运动的角度来看,迄今为止,由于自动驾驶车辆具有极高的跟踪性能,常被贴上“僵硬”和“过于稳定”的标签,与人工驾驶车辆存在明显差异,甚至被一些人欺负[2],[3]。

尽管作为有机体的人类驾驶员存在一些无法避免的问题,如巨大的个体差异、高度的不确定性、容易分心和疲劳等,人类专家仍被广泛视为最先进的高效控制器,这启发了由周其鉴于20世纪80年代初首次提出的称为人类模拟智能控制(HSIC)的理论体系[4]。HSIC的核心思想是学习人类专家的出色控制机制,以实现稳定的类人控制性能。本文针对车道保持任务,通过抽象专家驾驶员的转向特性,提出了一种基于HSIC的车道保持方法,该方法包含用于曲线跟踪的前馈控制以及用于间歇性误差校正的执行‐等待控制。目的是提出一种计算模型,以复制人类驾驶员在车道保持任务中的间歇性运动行为。一方面,HSIC模型将丰富当前关于驾驶员模型的研究文献,可用于交通流仿真;另一方面,该模型作为自动驾驶控制器可以提供类人特性,从而在机器接管转向权限时提高舒适性和适应性,在人车协同驾驶场景中改善过渡平顺性,并消除未来混合交通流中手动驾驶车辆与自动驾驶车辆之间的潜在冲突。

A. 相关工作

HSIC 是一种旨在模仿和扩展人类与动物在行为功能和结构功能方面表现出的优异可控性(动觉智能)的控制方法[4]。而人类行为建模(HBM)则试图描述人类的真实行为,更注重真实人类因素,如多样性、复杂性和随机性[5]。这两个概念在表征人工控制行为方面密切相关,但在目的方面存在差异。

在智能控制领域,前者旨在实现良好的控制性能;而在数学建模中,后者则用于更真实地描述系统。

针对车辆横向控制,已提出了大量驾驶员模型,主要可分为两类:基于经典与现代控制论的机理建模,以及采用基于神经网络的数据驱动方法的统计建模。

例如,双点视觉控制模型[6]是一种基于车辆“近”和“远”区域视觉信息的线性转向控制模型。文献[7]研究了人类驾驶员的视觉、神经与肌肉系统,并在机制层面上较大程度地复现了驾驶行为。许多机理模型在[5]和[8]中被综述。此外,还研究了一些考虑人为因素、能够反映人类驾驶员不确定性和个体差异的驾驶员模型,如[9],[10]。

随着机器视觉和线控转向系统的发展,基于经典控制理论、模型预测控制[11]和鲁棒控制[12]的自动驾驶车辆(车道保持辅助系统)主动转向控制算法也得到了广泛研究。

在统计建模方面,文献[13]提出了一种数据驱动的建模方法,用于揭示从自然驾驶数据中提取的人类车道保持运动原语,即基本转向脉冲。由于车辆与环境之间存在强交互作用,将自动驾驶视为监督学习问题较为困难。因此,基于深度神经网络的强化学习已成为自动驾驶领域的一个相对较新的研究方向。对于车道保持等单一驾驶任务,一种采用卷积神经网络(CNN)的端到端学习方法以前视摄像头数据作为输入,输出适当的方向盘转角以使车辆保持在车道内[14]–[16]。对于长期驾驶策略,深度强化学习(DRL)已被用于在超车、让行、汇入、左转和右转时与其他道路使用者形成复杂的交互技能[17],[18]。

共享控制是高级驾驶辅助系统(ADAS)中最重要的范式之一。人类操作者和系统的自动化通过触觉界面共同对控制输入[19]产生影响,因此减少人类操作者与自动化之间的转向冲突具有重要意义。文献[19]和[20]提出了一种类人驾驶员模型,该模型基于前馈与反馈控制,使机器更能感知人类行为,从而减少冲突。文献[21]评估了带宽控制与连续触觉共享控制,发现驾驶员并不一定偏好带宽(或间歇性)控制。然而,在[19]提出的模型的反馈控制部分,并未考虑人类驾驶员的间歇性。同时,间歇控制[21]被应用于共享控制方法中,而非用于驾驶员建模。

在文献[22]中,详细讨论了人工控制在目标跟踪任务中的间歇性现象,该现象的产生原因不仅在于人类具有缓慢的感知运动系统,而且这种间歇性也是一种有效的节能方式,降低人脑的计算成本以及降低人体肌肉系统的负荷。这种间歇性类似于T. 因斯佩格尔首次提出的“执行与等待”控制概念[23],通过周期性地开启和关闭反馈并结合高控制增益,可提高收敛速率,并可用于构建描述人工控制行为的生物拟态模型[13],[22]。但如何在良好的跟踪性能与较低的心理和操作负荷(计算和执行器成本)之间实现平衡?从HSIC视角来看,人类专家驾驶员在车道保持任务中最关键的特征是良好的预见性、精确执行和显著的间歇性,这些构成了最高效且先进的控制器。我们可以认为,良好的预见性和精确执行是良好前馈控制器的核心要素,并使得间歇性反馈控制成为可能。

B. 贡献

本文将HSIC概念引入自动驾驶车辆的车道保持中。提出了一种结合曲线跟踪前馈控制和间歇性误差校正执行‐等待控制的新型车道保持控制方案,并提供了基于切换系统相关方法的多模式控制稳定化方法。该基于HSIC的自动驾驶车辆车道保持方法旨在模仿从专家驾驶员中抽象出的优秀控制机制。前馈控制器通过提前精确调节方向盘以跟踪道路曲率,描述专家驾驶员的良好预见性和精确执行能力;反馈控制器则由于人类视觉系统对微小偏差的感知限制以及对可接受的跟踪误差的忽略,用于模拟专家驾驶员的间歇性误差校正行为。

本文的主要贡献如下: 1)提出一种基于HSIC的自动驾驶车辆车道保持控制新方法;2)提出一种具有执行与等待特性的多模态控制稳定化方法;3)在人车协同驾驶和混合交通流场景下,为自动驾驶提供类人特性。

本文其余部分组织如下。在第二节中,基于车辆与车道保持模型提出了HSIC结构。在第三节中,推导了HSIC控制器的参数范围以稳定系统。在第四节中,通过与其他方法的比较验证了HSIC的更优性能。最后,第五节给出了结论与未来工作。

II. 系统建模与问题描述

A. 车辆模型

本文中,由于理论推导与分析的需要,采用二自由度自行车模型近似描述车辆的横向动力学,如图1(a)所示。M,I分别表示车辆的总质量和关于垂直方向的惯性矩。lf,lr分别为车辆重心(VCG)到前轴和后轴的距离。cf,cr分别为前后轮胎侧偏刚度值。 β,r, δf分别表示侧滑角、横摆角速度和前轮转向角。车辆纵向速度Vx假设为常数。同样可以假设转向角和轮胎滑移角足够小,因此轮胎近似工作在线性区域,车辆操纵动力学方程如下(详见[24]):

$$
\begin{cases}
\dot{\beta} = a_{11}\beta + a_{12}r + b_1\delta_f \
\dot{r} = a_{21}\beta + a_{22}r + b_2\delta_f
\end{cases}
$$

其中
$$
a_{11} = -\frac{c_f + c_r}{MV_x}, \quad a_{12} = \frac{c_rl_r - c_fl_f}{MV_x^2}, \quad b_1 = \frac{c_f}{MV_x},
$$
$$
a_{21} = -\frac{c_rl_r - c_fl_f}{I}, \quad a_{22} = -\frac{c_rl_r^2 + c_fl_f^2}{IV_x}, \quad b_2 = \frac{c_fl_f}{I}.
$$

示意图0

B. 车道保持模型

自动驾驶车辆的车道保持模型如图1(b)所示。e是车辆质心(VCG)到期望路径上最近点的横向偏移量。航向误差 ψ定义为实际航向角ψa与期望航向角˙ ψd之间的差值,即 ψ= ψa −ψd, ψa= r。Vx和Vy分别为车辆的纵向和横向速度。此外, ρ(σ)是期望路径的曲率。根据[17],,自动驾驶车辆的车道保持模型可表示为

$$
\begin{cases}
\dot{e} = V_x\beta + V_x\psi \
\dot{\psi} = r - \rho(\sigma)V_x
\end{cases}
$$

对于车道保持场景,偏差 ˙e的变化趋势是系统的重要状态之一。 ˙e的微分方程可由(1)和(2)推导得出:

$$
\ddot{e} = a_{11}V_x\beta + (a_{12} + 1)V_xr + b_1V_x\delta_f - \rho(\sigma)V_x^2.
$$

结合(1)、(2)与(3),可定义状态向量ˆx(t)=[β re˙e ψ] T,控制输入 ˆu(t)= δ f ,以及扰动 ω(t) =[0 0 0 − ρ(σ)V_x^2 − ρ(σ)V_x] T,从而可推导出车道保持系统的状态空间表达式如下

$$
\dot{\hat{x}}(t) = A_{LK} \hat{x}(t) + B_{LK} \hat{u}(t) + \omega(t)
$$

其中

$$
A_{LK} =
\begin{bmatrix}
a_{11} & a_{12} & 0 & 0 & 0 \
a_{21} & a_{22} & 0 & 0 & 0 \
V_x & 0 & 0 & 0 & V_x \
a_{11}V_x & (a_{12}+1)V_x & 0 & 0 & 0 \
0 & 1 & 0 & 0 & 0
\end{bmatrix},
\quad
B_{LK} =
\begin{bmatrix}
b_1 \
b_2 \
0 \
b_1V_x \
0
\end{bmatrix}.
$$

示意图1

C. 基于HSIC的车道保持

正如我们之前提到的,HSIC的核心思想是模仿人类专家表现出的优秀控制能力。对于车道保持任务,专家驾驶员体现出高路径跟踪精度、小工作负荷和良好的预览能力。因此,为了设计HSIC,应首先抽象出专家驾驶员的控制方案。根据观察到的实际驾驶事件,提出以下三个假设。

假设1: 在车道保持场景中,当道路曲率即将发生变化时,专家驾驶员会提前调整方向盘转角(前馈),并在随后通过实时微调(反馈)来纠正横向偏移[19],[25]。

假设2: 在前馈过程中,专家驾驶员能够通过视觉系统获取道路弯道的预览信息,并通过学习和大量实践获得方向盘转角与预览道路曲率之间的映射关系[25]。

假设3: 在反馈过程中,专家驾驶员对决策过程中感知到的偏差具有一定的“执行与等待”特性,而不是完全平滑和连续的过程[22]。

备注1: 显然,“执行与等待”概念包含“执行”过程(根据感知到的偏差调整控制输入)和“等待”过程(由于视觉系统对微小偏差的限制以及对可接受的跟踪误差的忽略,保持前一时刻的控制输入不变)。

因此,我们可以抽象出专家驾驶员在车道保持任务中的控制模型,详见图2。开环部分用于跟踪由视觉系统获取的道路曲率变化。然而,只有当横向偏移量可感知且足够大以突破可接受边界时,闭环部分才会起作用,这取决于个人驾驶习惯和对跟踪精度的追求。具体而言,我们使用 s(e)表示反馈控制器与实际跟踪误差之间的死区滞环继电器环节,如图3所示,其中a为最小可感知跟踪误差的绝对值,b为可接受边界的绝对值,由于人类的随机性,这些是模糊边界。最终控制输入是开环部分与闭环部分的叠加。

此外,人体感觉运动系统在控制回路[22]中包含多个延迟元件,因此我们使用运动延迟和视觉延迟来表示神经肌肉系统和感觉处理的滞后。

对于自动驾驶车辆,需要一个车道保持计算模型。受上述专家驾驶员控制方案的启发,我们可以设计用于车道保持的HSIC,参见图4。人体感觉运动系统与自动化系统之间存在许多相似性,具体而言,视觉、神经和肌肉系统分别对应于传感器、计算机和驱动电机。车道保持计算模型由开环与闭环部分组成。

1) 前馈控制器

从数学上,我们假设输入( 1/ρ(t+τ_p):车辆前方道路曲率)与输出(δp:前馈前轮转角)之间的映射关系满足一阶惯性环节的特性:

$$
\delta_p = \frac{K}{Ts + 1} \cdot \frac{1}{\rho(t+\tau_p)}
$$

其中

$$
K = \frac{M V_x^2(l_r - l_f) + 2C_s(l_r + l_f)^2}{2C_s(l_r + l_f)} + \varepsilon.
$$

K,T是关键参数[22],可通过基于专家驾驶员实际驾驶事件的试错法进行标定。Cs为侧偏刚度, ε表示误差系数。

2) 反馈控制器

在我们校准了前馈控制器后,道路曲率的扰动可以近似忽略。因此,车道保持系统(4)可以重写如下。

$$
\dot{\hat{x}}(t) = A_{LK} \hat{x}(t) + B_{LK} \hat{u}(t)
$$

此外,为了更好地表示“等待模式”过程,可以通过将 ˆu(t)替换为u(t)= ˆu(t) − ˆu(t − t), t足够小 (等于计算机仿真中的采样时间),即将其转换为增量模型,即

$$
\dot{x}(t) = Ax(t) + Bu(t)
$$

其中 x(t) = [ˆx^T(t) ˆu(t − t)]^T,

$$
A =
\begin{bmatrix}
a_{11} & a_{12} & 0 & 0 & 0 & b_1 \
a_{21} & a_{22} & 0 & 0 & 0 & b_1 \
V_x & 0 & 0 & 0 & V_x & 0 \
a_{11}V_x & (a_{12}+1)V_x & 0 & 0 & 0 & b_1V_x \
0 & 1 & 0 & 0 & 0 & 0 \
0 & 0 & 0 & 0 & 0 & 1
\end{bmatrix},
\quad
B = [b_1 \quad b_2 \quad 0 \quad b_1V_x \quad 0 \quad 1]^T.
$$

由于存在传感器延迟 τs 和运动延迟 τm,设定 τ = τs + τm,可得到“执行与等待”控制器:

$$
u(t) = s(e)Dx(t − τ),
$$

其中,

$$
s(e) =
\begin{cases}
0, & e: -a \leftrightarrow a, 0 \rightarrow b, \text{ and } 0 \rightarrow -b \
1, & e: \text{else}.
\end{cases}
$$

因此,闭环系统可以表示如下。

$$
\dot{x}(t) = Ax(t) + s(e)BDx(t − τ).
$$

备注2: 根据上述说明,HSIC的一个关键特征是开环与闭环融合的多模式控制方案,该方案抽象自专家驾驶员的控制行为。因此,对于实际输入u∗满足

$$
u^* = u_{open} + u_{closed},
$$

其中uopen、uclosed分别表示开环和闭环控制输入。uopen可作为前馈补偿器,抵消由曲率变化引起的偏移量。uclosed可抵消由车辆和环境的非线性因素引起的误差。

D. 问题描述

与所有动态系统一样,稳定性对于HSIC系统也至关重要。然而,对所提出的HSIC系统进行稳定性分析是一项具有挑战性的任务,因为HSIC系统具有开闭环结合和多模态控制的特点,它既不是传统线性系统,也不是一般非线性系统。理论上,无论前馈补偿器添加在何处,都不会形成闭环,系统的特征方程保持不变,因此前馈补偿器不会影响系统的稳定性。目前的目标是如何设计“执行与等待”控制器,以使HSIC系统能够稳定工作并具备良好的预期性能。

由于切换系统具有一些典型特征,我们尝试将每个“执行控制器”和“等待模式”过程视为一个切换系统的子系统,并将事件驱动的切换模式(见(9)和图3)转换为时钟驱动类型。一个“执行控制器”和“等待模式”过程组成一个周期。子系统可以如下给出。

$$
\begin{cases}
\dot{x}(t) = A_{act}x(t) + B_{act}x(t − τ) & \text{for act subsystem} \
\dot{x}(t) = A_{wait}x(t) + B_{wait}x(t − τ) & \text{for wait subsystem},
\end{cases}
$$

其中 Aact = A_wait = A, Bact = 1 · BD = BD, Bwait = 0 · BD = O. 因此,切换系统可构造如下。

$$
\dot{x}(t) = A_{\sigma(t_k)}x(t) + B_{\sigma(t_k)}x(t − τ), \quad t \in [t_k, t_{k+1}), \quad k \in \mathbb{N}
$$

其中 σ(t):[0,+∞) → M = {1,2} 是一个分段常数函数,称为切换信号,用于确定每个时刻激活的子系统。当 t ∈ [tk, tk+1) 时,第 σ(tk)th 个子系统处于激活状态。我们可以假设 M+ = 1 表示“执行”模式,而 M− = 2 表示“等待”模式。显然,M+ ∪ M− = M。

“执行控制器”子系统为闭环,而“等待模式”子系统被归类为开环。对于闭环子系统,可以获得动态状态反馈的稳定性条件;相反,单独讨论开环系统的稳定性没有意义。因此,目标是设计合适的状态反馈增益 D 以稳定 “执行控制器”子系统,并设计适当的切换信号 σ(t) 以稳定整个系统。

III. HSIC控制器设计

在本节中,将给出“执行控制器”子系统稳定的充分条件(状态反馈增益D的范围),并推导出系统稳定的充分条件(任意周期内两个子系统的激活时间范围),旨在将事件驱动切换信号(见图3和式(9))转化为时间驱动切换信号。因此,HSIC系统的稳定性分析应分为两个步骤。

步骤1 通过李雅普诺夫直接分析法生成每个“执行控制器”子系统的稳定性条件;

步骤2 根据切换系统相关理论,推导出任意周期内 “执行控制器”和“等待模式”子系统的激活时间范围。

执行子系统中的状态反馈控制器设计

对于动态车道保持场景,由于车辆与环境的非线性,跟踪误差可能无法收敛到零,而只需满足一定的收敛速度和可接受的精度,这是一个典型的跟踪问题。采用李雅普诺夫直接分析法来讨论定义如下:李雅普诺夫函数可视为误差函数而非能量函数[4]。

定义1: 设Sq、EF、EA分别为期望输出集合、满足特定精度的误差集合和在可接受误差范围内的误差集合,其可以表示为:

$$
\begin{cases}
E_F(t) = {e_f(t) \mid |e_f(t)| < p} \
E_A(t) = {e(t) \mid e^2(t) \leq e_0^2 \exp(-\alpha \cdot p)}
\end{cases}
$$

其中p为给定的精度, α为动态衰减因子。显然,EF(t) ⊂ EA(t),若满足以下条件,则系统在区间[τf,+∞)上具有跟踪稳定性。

$$
\begin{cases}
\forall t \in [0, \tau_f], e(t) \in E_A(t) \
\forall t \geq \tau_f, e(t) \in E_F(t)
\end{cases}
$$

在跟踪稳定性的前提下,“执行控制器”系统的稳定性可通过以下定理得到保证。

定理1: 设定第 k 个执行控制器子系统的控制律:

$$
u_k(t) = D_kx(t − τ) = \beta_k[\alpha_ke_k(t’) + \dot{e}_k(t’)], \quad t’ = t − τ
$$

其中 Dk=[0 0 αkβk βk 0 0], αk=(1/τf) ln(|ek(tk − τ)/p|)

如果 βk满足

$$
\beta_k > |u_k(t)| / \alpha_k p
$$

然后,该闭环子系统具有跟踪稳定性。

证明: 在切换系统的第 k 个子系统中,对于 t ∈ [tk, tk+1), t’ ∈ [tk − τ, tk+1 − τ),选择一个李雅普诺夫函数候选

$$
V_k(t) = \frac{1}{2}e_k^2(t’)
$$

应视为误差函数而非能量函数,且Vk(t)的导数为

$$
\dot{V}_k(t) = e_k(t’) \dot{e}_k(t’).
$$

根据(16),我们可以得到

$$
\dot{e}_k(t’) = u_k(t)/\beta_k − \alpha_ke_k(t’)
$$

然后,可以很容易地得到

$$
\dot{V}_k(t) = u_k(t) e_k(t’)/\beta_k − \alpha_ke_k^2(t’)
$$

可以进一步得到

$$
\dot{V}_k(t) + \alpha_k V_k(t) = u_k(t) e_k(t’)/\beta_k − \frac{1}{2} \alpha_ke_k^2(t’).
$$

如果 ˙Vk(t)+ αkVk(t)< 0 成立,则满足

$$
u_k(t) e_k(t’)/\beta_k < \frac{1}{2} \alpha_ke_k^2(t’)
$$

严格来说,

$$
|u_k(t)| |e_k(t’)| < \frac{1}{2} \alpha_k\beta_k |e_k(t’)|^2.
$$

当 |ek(t’)| = 0 时,成立

$$
|u_k(t)| < \frac{1}{2} \alpha_k \beta_k |e_k(t’)|.
$$

若选择 βk> |uk(t)| /(αkp),则存在以下两种情况。

1) When |ek(t’)| > 2p= a
$$ \dot{V}_k(t)+ \alpha_k V_k(t)< 0 $$
|和|是有界的。a. 根据J.P. La Salle不变性原理,不等式(27)可解为
$$ e_k^2(t’)< e_k^2(t_k − τ) \exp(−\alpha_k t’) $$
b. 由(21)可得
$$ |\dot{e}_k(t’)| ≤ |u_k(t)| /\beta_k + \alpha_k |e_k(t’)| ≤ \alpha_k(p+|e_k(t_k − τ)|). $$

2) 当 |ek(t’)| < 2p=a时, ˙Vk(t)+ αk Vk(t)< 0可能不成立,但可以保证 |ek(t’)|和|有上界。
$$ |e_k(t’)| < 2p= a $$
$$ |\dot{e}_k(t’)| ≤ \alpha_k(p+ |e_k(t’)|) ≤ 3\alpha_kp. $$

总体而言,在由(16)和(18)表示的控制律下,ek2(t′)的轨迹始终位于图5的阴影区域内,即第 k 个“执行控制器” 子系统具有跟踪稳定性。至此,定理1的证明已完成。

B. 切换信号的设计

在获得每个“执行”子系统的稳定性条件后,需要设计出“执行”子系统与“等待”子系统之间的合适切换信号,以保证HSIC系统稳定。以下为方便起见,设T− k和T+分别表示第k个周期内“执行”模式和“等待”模式的总激活时间[27]。

正如我们前面所述,“等待”子系统可被视为不稳定系统,由于前馈控制器未能完全消除曲率扰动以及车辆和环境的非线性因素,跟踪误差将会发散。因此我们假设当 αk= −α2时,可在“等待”模式下找到李雅普诺夫函数的发散边界。在由定义1.所定义的跟踪稳定性前提下,HSIC系统的稳定性由以下定理保证。

定理2: 对于给定的正常数 α1、 α2,a 和 b,a< b,系统(13) 对于满足以下条件的任意切换信号具有跟踪稳定性:

$$
\begin{cases}
T_k^+ ≥ \frac{1}{\alpha_1} \ln\left( \frac{b^2}{a^2} \right) \
T_k^- ≤ \frac{1}{\alpha_2} \ln\left( \frac{b^2}{a^2} \right)
\end{cases}
$$

示意图2 的实际轨迹)

示意图3 的实际轨迹)

IV. 实验验证

本节给出了一些实验,以说明HSIC方法在车道保持任务中的性能。采用PreScan与CarSim的联合仿真(见图7)来测试控制器并获取数据(采样频率:20Hz)。

CarSim作为第三方软件与PreScan连接,从而可将CarSim提供的增强车辆动力学模型、PreScan提供的逼真场景和传感器资源以及驾驶模拟器统一到一个平台中。

以下实验需要两种场景:一种是“S”弯道(曲率见图9),另一种是变曲率道路(曲率见图19)。这两种场景均为双车道单向道路,车道宽度为3.5m。

示意图4

A. 人类驾驶员在车道保持期间的表现

在表I中给出了联合仿真平台中车辆模型的参数。我们招募了15名志愿者(5名女性和10名男性),年龄在23至30岁之间(M =25.2,SD = 2.1),持有驾照至少1年(M =3.6,SD = 1.6),参与实验。

我们采用主客观方法相结合的方式来对专家型与新手型驾驶员进行分类。在主观方法方面,我们根据驾驶年限和对驾驶模拟器的熟悉程度来区分专家型驾驶员与新手驾驶员。

此外,对于客观方法,我们选择从“S”弯道测试结果中获取的两个重要客观指标来对专家型与新手型驾驶员进行聚类,即偏移量的标准差和绝对偏移量的最大值,这两个指标是车道保持任务中的重要参数。

为了消除不同驾驶员偏好的影响,例如一些驾驶员在车道内行驶时倾向于稍微靠左,一些稍微靠右,要求志愿者尽可能沿车道中心行驶。聚类结果如图8所示。我们选择距离聚类中心最近的两个圆圈作为典型新手和专家驾驶员,用于后续比较。

示意图5

示意图6

示意图7

从跟踪精度角度来看,根据图8和图9,新手驾驶员的车道保持性能不如专家驾驶员,且在控制横向位置方面存在一定困难。相反,专家驾驶员在不同纵向速度下具有更好的车道保持能力和鲁棒性。

从转向操作的角度来看,图10显示,在相同驾驶条件下,由于专家驾驶员在实际驾驶和模拟器中积累了丰富经验,对车辆运动具有更好的预判能力以及更精确执行能力,因此其操作在幅度变化方面比新手驾驶员稳定且轻松得多。

为了进一步分析人工控制的间歇性,我们选取图10的第一个局部放大图作为示例,说明人类驾驶员在方向盘操作过程中的执行‐等待特性。对方向盘转角求导,得到方向盘轮角速度。当方向盘转角保持不变时,同时意味着方向盘角速度为零,即“等待”过程,反之则为“执行”过程(见图11)。在其他速度下也能观察到相同的现象。因此,无论是新手驾驶员还是专家驾驶员,在操作方向盘时都存在间歇控制行为。

示意图8

B. 控制器在“S”弯道上的性能

After we verified the intermittency of human control and the superiority of the expert driver as an advanced controller in lane keeping task, the performance of the proposed HSIC controller and other controllers will be presented as follows.

HSIC控制器(参数见表II)、前馈控制器、“执行‐等待”控制器以及单独的“执行”控制器均通过Simulink模型实现。LKA控制器是PreScan ADAS模块提供的测试示例之一,该模块已通过ISO17025认证。需要注意的是,“执行‐等待”控制器与HSIC控制器的唯一区别在于缺少前馈部分,而前馈控制器与HSIC控制器中的前馈部分相同。

示意图9

表II中变量b的取值非常重要,因为它表征了误差边界。变量b直接决定了HSIC模型的跟踪性能。本文旨在模拟人类驾驶员的车道保持驾驶行为,而非优化跟踪精度,因此我们通过提取人类驾驶员的驾驶数据来选择b的取值。具体而言,我们选择15名驾驶员在方向盘反向调整点处的横向偏差,旨在找出人类驾驶员危险偏移量的通用阈值。需要注意的是,该阈值并非最大横向偏差,由于车辆惯性,在方向盘开始反向操作时,车辆仍会沿先前方向继续漂移一段距离。

示意图10

示意图11

从跟踪精度角度来看,如图12和图13所示,执行控制器、车道保持辅助系统、专家驾驶员和HSIC控制器在车道保持方面表现良好,其中车道保持辅助系统的性能最佳。前馈控制器只能在短时间内将车辆控制在车道内,一旦车辆偏离车道便无法返回,这是因为在设计开环控制器时仅考虑了与道路曲率的线性关系。由于“执行‐等待”控制器缺乏前馈部分来消除道路曲率的扰动,在相对高速(25km/h和35km/h)下无法始终将车辆保持在车道内。此外,在跟踪误差方面,HSIC控制器略优于专家驾驶员。可以得出结论:良好的前馈控制器使得间歇反馈控制成为可能,并且从控制效果来看,HSIC控制器在匹配专家驾驶员行为方面具有更好的匹配性能。

示意图12

对于车道保持任务而言,只要将偏移量保持在安全范围内即可,因此执行控制器、车道保持辅助、专家驾驶员和HSIC这四个控制器均可视为合格的控制器。在接下来的部分中,我们将从转向操作、执行器工作负载、计算成本和乘坐舒适性三个方面,比较执行控制器、车道保持辅助和HSIC这三个控制器与专家驾驶员的相似性。

从转向操作的角度来看,如图14所示,车道保持辅助系统方向盘转角的小幅振荡反映了高频计算与操作的特性,因为车道保持辅助系统需要在每个采样周期内对检测到的误差作出响应。然而,HSIC控制器在三种不同速度下的方向盘转角曲线呈现出相对平缓的交替调整与保持过程,这与专家驾驶员相似,因为在控制方案层面,HSIC控制器仅需处理超出可接受范围的误差,而这是从人类驾驶员学习而来的。

更直观的表达如图15所示,专家驾驶员和HSIC具有“执行与等待”特性,而LKA和执行控制器则始终对检测到的误差作出响应,因此专家驾驶员和HSIC比执行控制器和LKA需要更少的计算成本。

然后我们分析LKA、Act、专家驾驶员和HSIC的转向角功率谱密度(PSD),以从频域特性上进行更深入的比较。从图16可以看出,Act、专家驾驶员和HSIC的PSD曲线相似,信号主要集中在0‐1 Hz之间,但LKA在1.6‐1.8 Hz和2.4‐2.6 Hz范围内的PSD显著高于专家驾驶员和HSIC。这一结果表明,相对高频的操作会增加执行器工作负载,是重要的证据。

文献[22]表明,大脑在执行运动任务时,无需连续地发出运动指令(执行控制器),即可以存在未设计运动指令的空白区域(等待模式)。考虑到运动控制计划过程会占用大脑的一些资源,大脑可能不希望在不需要或无法实现(偏移量较小)时启动新的运动控制计划。

HSIC模型从上述控制机制上模拟了人类驾驶员,因此与大多数工程控制系统不同,在后者中控制器(如Act和LKA)会持续计算控制信号并将其发送给被控对象。我们分析了专家驾驶员与HSIC在“执行与等待”特性上的相似性。因此,我们进一步比较了专家驾驶员与HSIC的“执行”区间分布(见图17)。专家驾驶员和HSIC控制器的“执行”过程的时间范围均在0s到2.5s之间,且在不同速度下的时间间隔分布也较为相似。

此外,我们使用总仿真时间中“等待”时间的比例来表示计算成本节省特性,如表III所示。这并非绝对表示,而是相对表示可节省多少计算时间。我们可以看到,与专家驾驶员类似,HSIC的计算成本节省特性随车辆速度增加而降低。

乘坐舒适性由复杂的生理和心理因素决定。根据文献[28],当自动驾驶系统接管车辆时,人类驾驶员变为乘客,如果系统能像其本人一样驾驶,他会感到更加舒适。如何量化并比较相似性?

一方面,根据ISO2631和试验台的限制条件,可选择横向加速度的最大值和均方根值等物理因素;另一方面,转向熵是转向平顺性和可预测性的指标[29],转向熵越小,平顺性和可预测性越好。结果如图18所示,根据这两个指标,HSIC与专家驾驶员的匹配性能最佳。

因此,我们可以得出结论:HSIC在转向操作、执行器工作负载、计算成本和乘坐舒适性方面具有与专家驾驶员相似的特征。

示意图13

示意图14

示意图15

示意图16

示意图17

C. 所提控制器的鲁棒性测试

为了进一步验证对道路曲率和车辆速度的鲁棒性,我们构建了变曲率道路和可变速度的场景。结果如下。

横摆角速度作为重要指标用于车辆状态分析。从图19可以看出,在时间范围0‐60 s和75‐110s内,四种控制器均能使车辆保持稳定,且专家驾驶员与HSIC在跟踪误差、横摆角速度和方向盘转角方面的性能相似。车道保持辅助系统的横摆角速度和方向盘转角均存在小幅振荡,也可视为稳定。然而,在时间范围60‐75s内,由于曲率发生较大变化,属于相对极端工况,专家驾驶员出现了较大振荡。尽管车辆并未失稳且始终停留在车道内,但仍属于危险驾驶情况。

相反,HSIC在横摆角速度方面具有最佳的性能。因此,我们可以得出结论:所提出的HSIC在保持车辆稳定性方面具有良好的鲁棒性。需要注意的是,专家驾驶员仅在此道路上驾驶过一次,经过多次练习后其表现会更好。

现在,我们将验证车辆速度的鲁棒性。参数K和T决定了前馈控制器的精度。因此,我们为不同速度选择不同的取值。然而,对于整体控制系统而言,反馈控制的引入大大降低了对前馈控制器的精度要求。因此,下图给出了车速为45km/h的场景,并使用了表II中35km/h下的控制器参数。根据图20所示的跟踪性能,可以看出该方法具有良好的鲁棒性。

此外,在一次仿真过程中,车辆的速度根据图21所示的两种模式变化。以及图22。我们添加了一个速度跟随模块来跟踪期望速度(周期为60s的方波和正弦函数)。同时,也使用了表II中35km/h下的控制器参数。

与速度为45km/h的场景中的性能类似,可变速度仅影响前馈控制器的性能,但反馈控制可以显著改善降低前馈控制器的精度要求。因此,根据在不同速度下的偏移箱线图(图23),我们可以直观地看出所提出的控制器对变速度具有鲁棒性。

示意图18

示意图19

示意图20

示意图21

示意图22

五、结论

本文致力于为自动驾驶车辆开发一种基于HSIC的新型车道保持方法。首先,从信息物理系统视角出发,分析了现有机器控制器在整体性能优化方面的局限性以及专家驾驶员的优势。其次,提取了专家驾驶员在车道保持任务中的关键特征,并将驾驶行为抽象为控制方案。最后,通过前馈控制器和执行与等待反馈控制器,将抽象出的控制方案移植到基于计算机的系统中,构建了HSIC控制器。此外,实验表明,所提出的HSIC方法能够提供类人特性,在两个方面具有优势:1)对于控制系统本身而言,与专家驾驶员良好的匹配性能可降低计算成本和执行器工作负载;2)对于驾驶员与交通而言,类人横向车辆运动可能有利于人车协同驾驶场景以及未来混合交通流中的驾驶员舒适性和过渡平顺性。因此,未来工作应进一步研究能够完善HSIC概念的自动驾驶车辆控制算法,并将其应用于与其他车辆、行人和道路施工存在强交互的更复杂场景中。

【四旋翼无机】具备螺旋桨倾斜机构的全驱动四旋翼无机:建模控制研究(Matlab代码、Simulink仿真实现)内容概要:本文围绕具备螺旋桨倾斜机构的全驱动四旋翼无机展开研究,重点探讨其系统建模控制策略,结合Matlab代码Simulink仿真实现。文章详细分析了无机的动力学模型,特别是引入螺旋桨倾斜机构后带来的全驱动特性,使其在姿态位置控制上具备更强的机动性自由度。研究涵盖了非线性系统建模、控制器设计(如PID、MPC、非线性控制等)、仿真验证及动态响应分析,旨在提升无机在复杂环境下的稳定性和控制精度。同时,文中提供的Matlab/Simulink资源便于读者复现实验并进一步优化控制算法。; 适合群:具备一定控制理论基础和Matlab/Simulink仿真经验的研究生、科研员及无机控制系统开发工程师,尤其适合从事飞行器建模先进控制算法研究的专业员。; 使用场景及目标:①用于全驱动四旋翼无机的动力学建模仿真平台搭建;②研究先进控制算法(如模型预测控制、非线性控制)在无机系统中的应用;③支持科研论文复现、课程设计或毕业课题开发,推动无机高机动控制技术的研究进展。; 阅读建议:建议读者结合文档提供的Matlab代码Simulink模型,逐步实现建模控制算法,重点关注坐标系定义、力矩分配逻辑及控制闭环的设计细节,同时可通过修改参数和添加扰动来验证系统的鲁棒性适应性。
【硕士论文完美复现】【价格型需求响应】基于需求侧响应的配电网供电能力综合评估(Python代码实现)内容概要:本文档围绕“基于需求侧响应的配电网供电能力综合评估”这一主题,提供了一个硕士论文级别的研究复现资源,重点聚焦于价格型需求响应机制在提升配电网供电能力方面的应用评估。文中通过Python代码实现相关模型,涵盖需求响应策略建模、用户用电行为弹性分析、配电网供电能力量化评估等内容,旨在通过需求侧管理手段优化电力资源配置,提升电网运行效率可靠性。此外,文档还附带多个科研辅助资源链接,覆盖智能优化算法、机器学习、电力系统仿真等多个技术领域,服务于综合性科研需求。; 适合群:具备一定电力系统基础知识和Python编程能力的研究生、科研员及从事智能电网、能源管理相关工作的技术员。; 使用场景及目标:①复现价格型需求响应下配电网供电能力评估模型;②深入理解需求响应机制对电网供需平衡的影响;③结合实际数据开展仿真分析,支撑学术研究或工程项目决策。; 阅读建议:建议读者结合提供的代码资源网盘资料,按照文档逻辑逐步实践,重点关注模型构建算法实现细节,并可通过修改参数或引入真实数据进行扩展性研究,以深化对需求响应电网能力评估之间关系的理解。
03-11
### HSIC定义及其在机器学习和统计学中的应用 HSIC(Hilbert-Schmidt Independence Criterion)是一种用于衡量两个随机变量之间独立性的核方法指标。该度量基于再生希尔伯特空间理论,在非线性依赖检测方面表现出色[^1]。 #### 定义 具体来说,给定两组观测数据 \(X\) 和 \(Y\) ,HSIC通过计算它们各自对应的特征映射后的协方差矩阵来评估两者间的关联程度。当且仅当\(X\)\(Y\)相互独立时,理论上HSIC取值为零;反之则表明存在某种程度的相关性。这种特性使得HSIC成为检验因果关系的有效工具之一。 #### 应用场景 - **神经网络训练优化**:研究显示HSIC可用于指导深层架构的设计过程,比如调整层间连接方式或者控制信息流传递效率等。 - **多模态数据分析**:由于能够处理不同类型的数据源之间的复杂交互模式,因此非常适合应用于图像识别、自然语言处理等领域内的跨域迁移任务中[^3]。 - **硬件接口设计**:虽然主要属于软件层面的技术,但在某些特定情况下也可能涉及到物理层面上的标准制定。例如有提到过一种名为Hub的设备可以兼容多种通信协议并提供广泛的传输速度范围支持[^2]。 ```python import numpy as np from sklearn.metrics import pairwise_kernels def hsic(X, Y, kernel='linear'): """ Calculate the Hilbert Schmidt Independence Criterion between two datasets. Parameters: X : array_like, shape (n_samples,) First dataset. Y : array_like, shape (n_samples,) Second dataset. kernel : string or callable, default 'linear' Kernel mapping used internally. This parameter defines whether to use a linear, rbf or any other type of valid kernels available in scikit-learn's `pairwise_kernels`. Returns: float: The computed value of HSIC criterion. """ K = pairwise_kernels(X[:, None], metric=kernel) L = pairwise_kernels(Y[:, None], metric=kernel) n = K.shape[0] H = np.eye(n) - 1./n * np.ones((n,n)) return np.trace(np.dot(np.dot(K,H),np.dot(L,H)))/(n-1)**2 ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值