协同驾驶超进化!CoDrivingLLM:大语言模型如何驱动决策框架?

点击下方卡片,关注“自动驾驶之心”公众号

戳我-> 领取自动驾驶近15个方向学习路线

今天自动驾驶之心分享同济大学在协同驾驶上的工作—CoDrivingLLM!大语言模型驱动的决策框架交互式、可学习的协同驾驶。如果您有相关工作需要分享,请在文末联系我们!

自动驾驶课程学习与技术交流群事宜,也欢迎添加小助理微信AIDriver004做进一步咨询

>>点击进入→自动驾驶之心大语言模型技术交流群

论文作者 | Shiyu Fang等

编辑 | 自动驾驶之心

写在前面 && 笔者理解

随着自动驾驶技术的不断进步,我们可能正在进入一个连接自动驾驶车辆(Connected Autonomous Vehicles, 简称CAVs)和人工驾驶车辆(Human-Driven Vehicles, 简称HDVs)共存的时代。尽管CAVs在提高交通安全和效率方面具有巨大潜力,但它们在开放道路上的表现还远未达到令人满意的程度。根据加利福尼亚州机动车管理局的报告,51%的车辆解绑是由于CAVs的决策失败造成的。此外,北京自动驾驶车辆道路测试报告揭示,高达91%的解绑事件发生在与其他车辆交互时,这表明目前的自动驾驶技术还不足以应对复杂的交互场景。为了改善这个问题,利用CAVs的协同驾驶能力是一个较为有希望的方法。

针对不同场景下的协同驾驶问题,目前流行的方法大致可以分为以下几种:

  • 基于优化的方法旨在最大化或最小化目标函数以实现特定目标。但是基于优化的方法往往未能在驾驶过程中明确考虑法规和社会规范,使得他们的决策结果难以理解。

  • 基于规则的方法在形式上简单,因此计算效率高。然而,尽管可以将基于规则的方法与交通法规结合起来,但预设的规则通常会导致鲁棒性差。

  • 基于学习方法,如深度学习和强化学习。这些方法已成功应用于交叉口、合并区域和高速公路等环境中的协同驾驶,表现出良好的性能。但基于学习模型的性能在转移到未经训练的环境中时往往会显著下降。

另一方面,近年来Transformer模型和大型语言模型(LLMs)的快速发展为实现协同决策提供了新的可能性。这些模型已经在自然语言处理和智能体决策制定等领域展示了巨大的潜力。在这种背景下,作者提出了一个交互式和可学习的LLM驱动的协同驾驶框架,用于全场景和全Cooperative Driving Automation(简称CDA)。

  • 论文链接:https://arxiv.org/pdf/2409.12812

  • 开源链接:https://github.com/FanGShiYuu/CoDrivingLLM

问题表述

目前,CAVs在开放道路上的表现仍然不是很理想。在某些场景下,CAV的事故率甚至是人类驾驶员的5.25倍,这显然不能满足人们对自动驾驶技术的期望。而CAVs的通信能力使其能够实现互联互通和相互协助。因此,利用协同驾驶能力是提高CAVs性能是作者认为非常有前途的方式。

多个CAVs的协同决策问题可以被建模为一个部分可观察的马尔可夫决策过程(POMDP)。作者使用元组来定义POMDP,其中代表所有被控制智能体(CAVs)的有限集合,表示包含所有智能体的状态空间。代表每个智能体的观测空间,表示动作空间,是与CAV 相关联的奖励。状态转移分布由表示。在任何给定时间,每个智能体接收一个单独的观测并根据策略选择一个动作。然后智能体根据给出的概率转移到新的状态。

观测空间 (Observation Space)

由于传感器硬件的限制,CAV只能在有限距离内检测到周围车辆的状态信息。作者将智能体的感知范围内所有可观察车辆的集合记为。智能体的观测矩阵是一个尺寸为的矩阵,其中代表智能体可观察到的车辆数量,代表用于描述车辆状态的特征数量。车辆的特

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值