自动驾驶环境中的全局风险评估:对车辆和驾驶员的影响
摘要
高度自动化驾驶(HAD)是未来“智能”道路出行方式的重要组成部分。在此背景下,一些研究表明,驾驶员在使用高度自动化驾驶时的情境意识会下降。在高度自动化驾驶场景下,驾驶员可以进行阅读或睡眠等非驾驶任务。这些非驾驶任务会导致在出现危险情况或高风险事件(如硬件、传感器、执行器故障,或前方障碍物或碰撞,或严重交通拥堵,或恶劣条件)时反应时间增加。本文提出了一种利用来自周围车辆或基础设施(V2X通信)的局部信息计算的全局风险指标。本文首先展示了该全局风险指标相较于局部指标的优势,其次分析了其对自动驾驶汽车和驾驶员行为的影响。
关键词 : 自动驾驶;扩展感知;全局风险;协同系统;驾驶员行为
1. 引言
驾驶自动化自汽车诞生以来一直是研究的课题。20世纪90年代,随着车载电子设备和传感器的日益普及,相关研究逐渐兴起。当辅助系统完全自动化地实现纵向和横向控制,且无需驾驶员监控系统时,即实现了高度自动化驾驶(HAD)[1] 28 29。目前HAD尚不被视为完全自动驾驶,因为它只能在特定的运行参数下工作,例如在特定的道路环境中。此外,重要的是,在发生关键事件时,HAD通常需要驾驶员重新接管手动控制;而在完全自动驾驶中,系统能够自行应对危险情况并恢复到低风险状态。
在 [30], ,SAE定义了自动驾驶等级分类,该分类现已被整个从事此领域的社区广泛使用。在3级和4级(与驾驶员共享驾驶任务)中,HAD系统会在驾驶员需要重新接管控制时提前发出预警,尤其是在即将达到系统极限或检测到某些紧急事件时。在某些实现方案中,自动化功能可能对紧急事件做出响应,但这种响应通常会因要求驾驶员接管而产生延迟 [2]。因此,驾驶员只有在经过一段延迟后才会做出反应,该延迟包括系统评估紧急事件的系统延迟以及驾驶员感知并理解状况并做出适当反应所需的时间。驾驶员的反应时间已被证明会受到多种因素的显著影响,例如警觉性降低、情境意识不足或参与次要任务(如读书、玩电子游戏、观看视频等)。[32] 提出对自动驾驶汽车与驾驶员之间的过渡阶段进行研究。 [34] 对非关键控制转换中的反应时间提供了良好的综述。在无驾驶辅助系统时发生的大量碰撞主要是由于人类感知问题、理解不足、对路况的错误评估、不恰当的操作行为或无关决策所致(图2)。因此,在驾驶任务共享以及低水平道路环境注意力的情况下,驾驶员将更难完成这些人类任务。
本文中,我们验证了以下假设:车联网通信(V2X)可用于在需要驾驶员操作的紧急事件发生前延长预警时间,这对高度自动驾驶系统本身和驾驶员均有帮助。我们的标准场景是在高速公路车道上发生的连环相撞事故。该事故的原因与我们的研究无关;自动化
1.1 原理
众所周知,人类是自动化任务的薄弱监管者 [4] 5。先前的研究发现,使用高度自动化驾驶(HAD)和自适应巡航控制(ACC)会增加在关键事件中的反应时间 [6]。然而,也有研究表明,及时预警足以避免大多数碰撞 [6]。
研究发现,高度自动驾驶驾驶员对交通信号灯变化或接近车辆的反应时间比手动驾驶驾驶员长2.5秒 [7]。多项研究聚焦于前车紧急制动场景,结果始终显示高度自动驾驶驾驶员的反应速度慢于手动驾驶驾驶员:分别慢28% [8], 、42% 3,和88% 9 。这种较低的反应速度可归因于驾驶员更容易从事与驾驶无关的活动 [10],或因单调性引发困倦 [6];在高度自动驾驶条件下,被动性极有可能出现 [11]。加之非驾驶相关活动的干扰可能性增加,高度自动驾驶驾驶员通常以比其他驾驶员更短的车头时距行驶。例如,在交通拥堵初期 [12] 发现,高度自动驾驶驾驶员的平均车头时距为2.2秒,而手动驾驶驾驶员和自适应巡航控制驾驶员分别为3秒和2.8秒。
然而,一些尚未完成且需要谨慎对待的研究也表明,适当的预警可以使大多数驾驶员能够及时应对紧急事件 [6]。例如,Gold等人 [13] 已经证明,提前7秒发出控制权移交的预警,足以使高度自动驾驶驾驶员安全地重新接管车辆控制并避开前方的静止物体。而后者作者的研究中 [34] 报告称,无论是预期中的恢复还是由于紧急事件导致的恢复,早期恢复所需的最短时间为15秒,而车辆稳定则需要40秒。一些近期研究表明,通过实施驾驶员培训[36],可以在一定程度上缩短反应时间。此外,通过为驾驶员提供针对驾驶员的适配辅助,例如在情况变得危险之前至少提前6秒引导驾驶员注意危险源[37],也可以进一步改善反应时间问题。
本文旨在证明,V2X技术能够为高度自动驾驶驾驶员提供提前预警的性能,并普遍优于仅基于局部信息的系统。
在高速公路上考虑一连串车辆时,仅使用车载传感器相比V2X技术的劣势显而易见:紧邻的下游车辆会遮挡更远端下游车辆的视线。如果在自车数百米外发生紧急事件(如紧急制动、失控等),无论是其驾驶员还是任何传感器都无法获知该事件。随着后续每一辆车反应时间的累积,驾驶员很可能没有足够的时间做出反应,尤其是在存在一定程度自动化的情况下,随之而来的反应时间增加和车头时距减小进一步加剧了这一问题。而V2X将允许将事故信息快速传播到整个车队。
我们此前已在 [14] 赛道上研究了一种简单预警信息发布系统的性能,并收集了大量关于车联网性能的 [15] 数据。本文将证明,在紧急情况下,结合本地传感器和车联网的增强感知系统确实可以为高度自动驾驶驾驶员提供额外预警。
2. 方法论与系统架构
本研究聚焦于仿真。我们设计了一个模拟的增强感知系统,该系统从本地(自车传感器)和远程(其他车辆)来源收集信息,并将其融合成一张统一的“增强地图”;任何相关信息均可存储在此地图中。仿真由基于实测数据构建的车联网性能模型 [16] 支持。随后,通过多次重放一个测试场景以实现不同的车头时距变化;该场景涉及在高速公路环境下一辆车辆突然进行紧急制动。
我们的方法采用两个层次的仿真抽象。首先,是与单车相关的微观仿真。我们使用的仿真是 [18] 中描述的 SiVIC‐RTMapsTM 框架。SiVIC 设计用于支持少量车辆(通常少于 10 辆),无法模拟大规模交通。第二层抽象使我们能够模拟大量车辆之间的交互;这是一种微观交通仿真,与无线网络仿真器相连。我们使用了 VEINS [19] 框架,该框架将开源的 SUMO 交通仿真器与 OMNet++ 网络仿真器相结合。这两种方法相互补充,使同一场景能够在个体和集体两个层面进行测试。针对这两个不同层次所需的方法论调整将在适当位置进行说明。
在接下来的子章节中,我们将进一步详细阐述模拟增强感知架构的各个部分。
2.1 软件组件
所使用的两个软件是SiVIC‐RTMapsTM和VEINS。我们在SiVIC‐RTMapsTM中开发了C‐ITS仿真框架,如 [18, 20 ] (图3)所示。SiVIC可用于对车辆、基础设施、嵌入式传感器和通信手段进行建模与仿真。RTMaps是用于实现协同式先进驾驶辅助系统应用的原型平台。在仿真框架中添加了一个特定场景模块,该模块也在 VEINS中进行了相应调整,以使通信和控制算法能够类似地运行。
2.2 本地感知
增强感知系统的基础是局部感知。所有车辆都配备了多种本体与外部感知传感器。
全球定位系统(GPS)以及任何组合的惯性传感器均可用于定位,而车辆则通过雷达或激光扫描仪感知其环境。
在本研究中,所有车辆均配备了全球定位系统(GPS)和前向测距传感器(激光雷达)。自车及其他物体由传感器构建的信息以标准化的状态向量存储,每50毫秒更新一次。该状态向量包含:(1)唯一物体标识符,(2)时间戳,包括在公共时间参考下的最新时间戳 T,(3)两个坐标系(WGS84 和兰伯特等角圆锥投影)中的位置,(4)速度向量,(5)物体的方差‐协方差矩阵,(6)物体存在置信度(表示数据质量),(7)物体首次检测到的时间戳,以及地图构建过程中使用的多个标志位。
2.3 车联网通信
车联网仿真在每种软件架构中有所不同。在 SiVIC‐RTMapsTM中,自定义构建的应答器系统[20]与我们的性能模型 [16] 配对使用。在VEINS中,则模拟了完整的 WAVE协议栈;采用Sommer e a. [23] 的性能模型,该模型同样基于实测数据收集,得出的性能与我们的模型非常相似。两种模型之间的主要区别在于它们所针对的仿真类型: Sommer e a.的模型专为通信研究设计,而我们的模型则是为支持协同应用研究而设计的计算成本低的模型。每辆车辆以2赫兹的广播频率广播其自身状态向量以及通过本地传感器检测到的任何物体的状态向量。
2.4 扩展与增强感知
增强感知架构的处理过程分为三个阶段:(1)时空同步,(2)关联与跟踪,(3)融合。该架构面向去中心化的地图构建方法设计,即每辆车辆自行计算其增强地图。状态向量来自自车的本地感知系统,并通过V2X从其他车辆接收。
车辆通过线性卡尔曼滤波器的预测步骤实现空间和时间上的同步。对象行为在被视为“当前”时间的公共时间戳下进行评估。关联与跟踪采用文献 [25]中提出的鲁棒多假设跟踪(MHT)算法,将先前已知的物体与新数据进行关联。最后,融合阶段通过线性卡尔曼滤波器的更新阶段将新旧物体进行融合。增强地图在功能上类似于局部地图,但由于融合了更多数据源的信息,其包含的物体更加精确。数据流受到严格控制,以避免任何数据独立性问题(例如,增强状态向量从不被广播)。
2.5 全局风险评估
为了对重大紧急事件提供早期预警,系统需要了解当前驾驶环境的风险程度。这是通过“增强风险”R a g实现的,该指标是一种基于个体风险计算出的瞬时碰撞风险指标。
[40] 表明,碰撞时间(TTC)和车头时距(TH)结合使用,可较好地近似减速情况下的风险。单一标准无法应对特定情况:如果车辆以相同的平均速度近距离行驶,这种情况比车辆保持较大距离行驶时更具风险,而此时碰撞时间(TTC)与实际风险并不一致。在之前的研究中,我们结合了这两个指标来表示碰撞概率。
此处,个体风险指标根据当前状况和环境中车辆的预期操作行为进行评估 [26];作为一种风险,它依赖于两个组成部分。首先,使用蒙特卡洛测试对目标车辆在其环境下的多个参数(驾驶员反应时间、驾驶员操作等)进行碰撞概率评估。其次,如果发生碰撞,其碰撞严重程度将基于碰撞时刻的速度差计算为追尾碰撞(使用基于 EES–等效能量速度的最大简明损伤评分)。随后,增强风险通过一个三步过程构建。设有一队列包含n辆车:{ 1,…,v }。对于一对车辆i和j,存在R j, i ,表示由车辆 i测量的这两辆车之间的碰撞风险。R j, i ∈[0,1]。如果风险等于1,则事故不可避免或已经发生。根据每辆车辆可获得的信息,我们可能会有R i ,j ≠ R j, i 。
配备多种传感器或V2X通信的车辆,对其能够检测到的每一辆车辆都存在一个风险数组: { R 1, i,…,R, i }。在此基础上,我们可以创建一个全局风险值R g , i,该值被定义为车辆i所感知的全局碰撞风险。当车辆能够访问多个信息来源时,该值变得尤为重要。重要的是,附近另一辆车辆可能无法访问相同的信息;因此,每辆车的 R g , i值将根据其对整体驾驶环境的感知能力而变化。公式1展示了我们如何计算R g , i 。
R g, i= (R 1, i,…, R,i) (1)
如果所有车辆都共享其对驾驶环境的各自感知风险,那么我们可以创建一种增强型碰撞风险,称为R a g (公式 2)。 R a g是整个驾驶环境的综合风险。 R a g在范围受限制时最具信息性;事实上,如果在1,000辆车辆的序列中仅发生单个危险事件, R a g只会使总风险略微增加。
(2)
R a g 是一种风险估计值(从通信车辆中获取),当通信车辆之间发生事故时,该值将大于本地风险 R j,i 。了解整体风险 R a g 将为系统或驾驶员提供额外的反应时间(例如通过禁用高度自动化驾驶)。我们的方法与 [27] , 中计算的基于平均的风险值类似,但更为简单,因为我们未对从其他车辆接收到的风险值进行加权。
我们选择 0.7 作为 R a g 的危险阈值,该值对应较高的事故概率(尤其是涉及多辆车辆时)以及更高的严重程度范围。该阈值也足够高,以避免在整体驾驶环境风险不高的情况下,单个车辆使风险过高。
然而,由于基于VEINS的仿真存在方法学上的局限性,该阈值无法直接使用。实际上,VEINS无法模拟事故,只能模拟近失事件(极短的车头时距)。因此,风险值无法达到 1(尽管我们可以在后处理中通过强制设置风险值人为实现)。这促使我们在该特定仿真中采用了一个更小的阈值0.4。
3. 结果
SiVIC 仿真在萨特里(法国)测试赛道的复制品上进行,代表了高速公路的单车道。刹车事件的位置是预先确定的,车队的组成也是如此,但车头时距是随机的。该场景涉及五辆车辆,其中领头车辆执行紧急制动。控制算法 [18] 试图保持2.5秒车头时距,并以0.5秒的类人反应时间对变化做出响应。每辆车根据本地可用的数据评估其R g , i值。由于它们仅配备前向激光雷达,R g , i等于R i -1, i ,即前方行驶车辆的风险。在分析中,我们重点关注末尾车辆(i =5)。图4展示了两次仿真运行的结果,更多结果汇总于表1中。主要分析指标是d 5 , ,即 L ,5(本地感知返回的风险超过危险阈值的时间)与 A (增强感知返回风险超过危险阈值的时间)之间的差值; A 和 L ,5表示临界事件后秒数。图中展示了所有R g , i值,以及R 4,5 (黑色虚线)和R a g (红色实线)。在该场景中,自动驾驶控制器没有足够时间做出反应而发生事故,因此风险值全部急剧上升至1。如表1所示,d 5至少为6秒。仅本地系统提供的预警时间在最佳情况下最多为5秒,但通常更短,例如第五辆车的情况(2到3秒)。注意,该时间是在车辆i与车辆 i-1发生碰撞之前计算的,因为车辆i无法获知比车辆i-1更前方的情况。持续的6‐7秒d 5值表明,增强感知系统能够提供必要的预警(最早可在潜在碰撞发生前13秒),使驾驶员在下游几辆车处发生紧急事件时能够从高度自动驾驶模式重新接管控制。整个车队意识到危险的平均时间为3.56秒。此结果的局限性在于,距离紧急事件较近行驶的车辆无法从增强感知系统中获益太多。
VEINS仿真在一个精确复现的太平洋高速公路路段上进行,该路段距离布里斯班中央商务区45公里。刹车事件的具体位置以及当时车队的构成是随机的;交通密度为每小时2500辆。该场景的目的是通过不同的方法验证前一节中获得的结果。
图4展示了一次运行的示例;X轴表示紧急事件发生后的时间。红线是R a g,其他线条是各个车辆中的不同R g , i (各车辆的本地风险),请注意,这些风险在一段时间后会下降,因为SUMO的跟车模型不允许发生碰撞;每个子图展示了通过递增方式获得的增强风险计入的车辆数量。这很好地说明了在评估R a g时选择合适半径的问题:如果包含的车辆过多,由于这些车辆距离紧急事件过远,会导致低估。中间子图对应于与SiVIC仿真相同的情况。
| A | L,S | d S |
|---|---|---|
| 4.65 | 11.56 | 6.91 |
| 3.28 | 10.55 | 7.27 |
| 3.52 | 9.86 | 6.34 |
| 3.6 | 10.83 | 7.23 |
| 3.16 | 10.81 | 7.65 |
| 3.2 | 10.43 | 7.23 |
表1:在6次仿真运行中,d的变化情况,表示车队中第五辆车可用的额外预警时间。
VEINS的结果与SiVIC的结果呈现出相似的模式:增强风险可用于改善本地感知系统提供的预警时间。具体的数值结果见表2。第五辆车在事件发生约10秒后通过本地感知(与之前的仿真相同)收到预警,若使用4辆车计算 R ,则可获得约3秒的额外预警。强制发生事故(设置 R,2为1)时结果类似(见表2最后一行)。不同的方法论,特别是VEINS中缺乏SiVIC中实际可能出现的极端操作,解释了这一差异。
4. 对车辆和驾驶员的影响
本文中,我们仅关注驾驶员反应时间这一驾驶行为参数,以研究车联网对安全性的影响。我们的一个研究视角是将驾驶员在紧急情况下所采取的轨迹决策的安全影响纳入考量。实际上,根据道路场景配置以及驾驶员对情景的感知能力水平,他们可能会决定向右或向左转向(例如为避开前方车辆),或者选择保持原有轨迹。在安全影响评估方面,另一个补充维度在于评估驾驶员的操作行为和决策对环境及其他道路使用者(例如手动挡汽车驾驶员、自动驾驶模式下的自动驾驶汽车、两轮车驾驶员等)所产生的后果。
此外,文献中已记录了驾驶自动化对人类影响的多个方面,涉及性能和安全性。驾驶员可能对自动化过度自信,并倾向于脱离驾驶任务。他们可能会经历精神超载或负荷过低的情况,对自动系统的运行状态以及驾驶情境的理解能力减弱。从中长期来看,他们还可能丧失安全驾驶和操作汽车所需的技能。一些研究者还指出,使用驾驶自动辅助的驾驶员会出现向更高风险行为转变的趋势。
例如,[38] 表明定速巡航使用者反应更迟缓,且会减小安全余量。最近,[39] 观察到使用自动紧急制动系统结合带有警报时,驾驶员在发生紧急事件时更倾向于让自动化系统做出反应;而在没有提前预警的情况下,有更多驾驶员会在自动化系统之前进行干预。尽管所有这些风险因素都会影响驾驶员适当反应所需时间,但在所需辅助和风险预防措施以支持恢复控制方面,它们具有不同的含义。利用SiVIC框架使用专门设计的场景,可能为在更“系统性”的层面上评估这些因素对安全性的影响提供一种有效手段。
结论与未来工作
本文中,我们验证了V2X技术能够为处于HAD模式下运行的车辆提供早期预警,以便其驾驶员在发生紧急事件时能够安全地重新接管控制。我们的主要指标采用了基于本地传感器收集并通过V2X网络传输的信息计算得出的“增强风险”概念。通过两种不同的仿真环境,我们发现,在5‐6辆车的车队中,大多数车辆使用V2X的效果优于本地感知系统(如自适应巡航控制)。本地感知系统通常只能在自车撞上下游车辆前提供不超过3秒的预警。先前的研究表明,3秒不足以让高度自动驾驶驾驶员完成控制权的重新接管。而V2X技术能够在本地感知所提供时间的基础上增加6‐7秒。借助V2X,整个车队可在事件开始后约3.56秒内接收到关于该紧急事件的预警,并且上游车辆获得的预警时间逐渐增加。我们的结果还表明,在增强风险的计算中所考虑的车辆数量是实现及时预警的一个非常重要的因素。
1599

被折叠的 条评论
为什么被折叠?



