无人驾驶决策规划科普向

科普|无人驾驶决策规划,了解一下?_哔哩哔哩_bilibili

本文是对B站up主厉害的墨墨的视频总结。

  1. 自动驾驶车辆的行为决策和路径规划它们分别指什么?为什么要放在一起?

虽然做的事情有差别,但他们所使用的方法有很多相通地方,关系紧密,方法相通。

行为决策主要指的是做抽象的驾驶决策,比如说我现在应该是跟车还是换道;路径规划是做具体的运动轨迹设计,就比如说我已经决定要换道的话,我应该沿着怎样的一条曲线去完成这个换道动作,如何加减速实现超车或者避让;这两者是有一个非常紧密的前后承接关系的。

  1. 决策规划与日常的车辆的导航是的区别?

车辆导航的话可以说是一个更上层的决策,它主要决定的是我们从一个地方到另外个地方,应该走哪条路,它是一个非常宏观的路径。它并不决定车辆什么时候该刹车,或者是该转多少方向盘。但是我们的决策规划计算的是一个微观的一个路径,它是具体到车辆的操作层面的,直接指导车辆接下来应该加速还是减速,应该转多少方向盘。

  1. 室内、公园和马路的决策规划有区别吗?为什么会有这种区别?

室内公园环境因素简单,只需要考虑安全问题。马路需要考虑安全、舒适、效率,还要考虑交通规则、开车习惯、你对别人的影响等等,形成新的约束。公园室内基本是非结构化的环境,马路是典型的结构化环境,有标志标线、信号灯,定义了开车规则。而非结构化环境缺少了这些先天条件,对地图、感知更难。

  1. 自动驾驶与传统机器人的决策规划并不一样。

个人看法,自动驾驶的决策规划应该属于机器人导航规划的一个阿克曼底盘的结构化交通场景应用吧,是不是说难度量级有4~5倍有点儿不太严谨呢,毕竟机器人导航规划应用在不同的场景都有不同的约束和难度,比如多机协作避障导航,crowd navigation,exploration等需要考虑到的约束也很多,复杂程度也很高,尤其其中有一些隐形约束需要人为建模的,难度并不比自动驾驶目前的决策规划要低太多

你说的是多机器人协作规划才是知道其他机器人的路径,正常单体移动机器人建图、规划、避障也是不知道其他机器人的路径的。总之,单论范畴,自动驾驶决策规划属于机器人决策规划范畴,是结构化交通场景多规则约束下的某一种一种机器人(阿克曼底盘)决策规划,如果说复杂程度,严谨的角度说自动驾驶决策规划比普通单体agv的决策规划确实复杂的多,但机器人范畴太大了,针对不同应用不同约束不同问题,复杂程度也不同。

  1. 自动驾驶车遇到了无保护左转的情况下,是规则优先还是学习优先?

规则优先,规则源于人实际开车的习惯,比如说人类在面临无保护左转的场景的时候,首先遵守左转让直行的规则,其次在让行的时候,对于让行的位置的选择,也是有大家开车约定俗成的习惯,这些都是制定规则的依据.,你也可以认为它是数据。规则只是抽象的上层的定义,实际执行时候我们会去运算,真实的不让行的可能性有多高。(考虑到对方车速),正常的所有的决策都是要考虑环境当中其他车辆对于你当前行为的响应。

  1. 考虑天气、温度参数的情况下,如何根据不同车型,不同车况具备稳定的一致性?规划出一条比较完美的路线?

如果是针对不同的车型车况,这个东西是可以通过标定车辆底盘的响应特性,把这些数据参数输入到我们的算法当中 去保障车辆表现的一个一致性,目前天气温度还不在决策规划算法考虑的一个范围之内。因为它并不直接和决策规划的某些东西关联起来。比如雨雪天,对速度限制做一部分约束,并不对应到某一具体参数。

  1. 目前规划是否有充分的利用计算单元(GPU)去做并行计算?

目前规划上面这块还没有调GPU来进行并行运算因为决策规划目前还是一个讲因果关系的它一个典型的一个串行的一个思路,所以并行的算法起到的作用还不是特别大,假设类似于穷举去选优的方法的话,你可以用GPU并行运算出非常多条轨迹,然后再从轨迹里面挑选最优的轨迹。我们的整个算法框架是一套基于优化的思路,所以它是在不停的缩小我的优化的解空间,逐层计算。

  1. 自动驾驶车辆一次决策规划需要多长时间?这个时间能否保证安全?如何保证安全?

人类司机做一次决策大概是400-500毫秒,目前我们做一次决策规划大概是100毫秒左右。理论上可以保证安全,另外一方面,通过对环境的预测,在决策规划中设置各种安全余量,理论上这个计算时间是能够保证车辆安全的。并不是绝对安全,而是不主动造成安全风险。

  1. 决策规划比较知名的难点?相对应是否有解决方案?

一个是如何应对前端的不确定性,比如我们前端感知会给出障碍物的位置这些信息,但这些信息是存在误差的,另外我们前端的预测模块会给出障碍物轨迹预测,但这个轨迹预测结果也是一个概率性的东西,然后如何理解并处理好这种不确定性问题,对于决策规划来说是一个挑战;另一个是如何像人一样开车,目前的决策规划和人比起来还是显得会呆板一点,然后如何像人一样能够处理环境中发生的异常,如何与其他车辆做出更加智能的交互?

从算法本身的角度来说,决策规划的关键问题是解决车辆这个特定对象导致的一系列难点,例如决策规划的结果的时间一致性时间一致性(time consistency problem) 问题,又称时间不一致性。指政府在制定某一政策之时(t-1),该政策是最优的;但在t时刻,在没有承诺机制的情况下,政府可能根据当时的情况重新制定最优的政策。在这种情况下的均衡状态下所实现的社会福利,将低于政府在t-1时刻承诺在t时刻仍实行与此前相同的政策所实现的福利。具体到货币政策的制定上,这一理论有力地支持了实行规则性的政策而非相机抉择。),车辆的非完整约束人对舒适性的要求等等

从决策规划问题定义的角度上来说,需要设计一套合理的求解决策规划问题的流程和方法,以使得无人车表现出与人类类似的行为特点,并且适应各种复杂的工况。而目前比较好的设计思路就是学习人类驾驶员的决策规划过程,首先的环节应该是对环境的理解和认识(又叫认知)。

如何在无人驾驶中做好认知?也是决策规划的关键问题之一。感知是描述车辆周边有哪些对象,他们的位置、类型、大小、尺寸、速度、方向等等信息,而认知首先是建立这些对象之间以及他们和自车的联系,然后分析每个对象,包括自车当前为什么是这种状态,以及未来会变成什么状态最后基于这种联系和状态变化,给出动态环境的一些相对主观的评价感受认知中得到的联系状态变化感受和动静态环境信息,最终都是要做决策规划的依据。     比如感知识别到了车辆周边有几条车道线,并且在车辆前方有一台速度很低的车在打双闪,那认知过程中,首先会认识到这台车,是我同车道的前车,他开的很慢,并且已经持续好一会的慢速度,然后从双闪来看,可能出现什么问题了,可能还会持续低速很久,所以如果我继续跟着他的话,我也会持续开得很慢,不知道什么时候会到达终点。但是旁边的车道又没有车,如果过去的话应该可以很快的达到目的地,并且也没有什么危险也不违反交通法则,所以认知到这些信息后呢,就会给到决策规划,很容易得出此时他要换道的决策规划的结果了。

  1. 智行者商业化落地所面临的问题?你知道我们的robotaxi是不作为智行者的一个商业化落地的一个方向,为什么呢?

乘用车落地的问题很多,第一点,乘用车自动驾驶的目的到底是什么?目前自动驾驶还需要安全员。你的技术能力是否达到了能够在保障安全的情况下实现自动驾驶,这是一个系统的问题。就是有一些场景是你一开始可能设想不到的,这样会导致你的系统设计范围是有限的。那么你一个有限系统范围的系统设计去应对一个可能无穷无尽的一个应用边界的时候,显然会出问题。

  1. 视频中提到无人驾驶公司需要大量的里程数据。那么现在搭载类似辅助驾驶技术的汽车能不能通过收集人类驾驶汽车的数据来训练ai,进一步问,这样做的车企多不多?

已经有挺多这方面的实践了,像模仿学习之类的,基本上用深度学习做决策规划的都会用到驾驶员数据,没记错的话,cruise、特斯拉都这么干。

预测决策从业者也来分享一下:现在业内做到量产的方案主要还是两种思路,一就是基于条件规则式的例如博世的,逻辑跳转条件明确,好处就是可以确保本车是完全遵守交规的(出事也可以保证我方次责或无责)以及可解释性强,缺点就是天花板低,复杂和极限工况捉襟见肘;第二就是基于经验学习,灌大数据例如特斯拉小鹏,好处是随着优质数据量规模的提升,有希望做出最接近人类思路的决策,缺点就是不可解释,出现的失误或者意外难以解释,只能继续补充数据补充。做为从业者其实对这行儿还是充满憧憬的,也期待能有突破性地算法创新能给大家多赋赋能。

robotaxi有太多难以解决的长尾问题,大量突发的corner case 目前L4主要方向的robotaxi只能局限于限定区域内工作,车内还需要配备安全员。车内还需要加装摄像头,来关注安全员是否专注。 robotaxi还是小范围内进行测试运营,技术、产品无法支持大范围落地,所以一直未达到商业闭环。 自动驾驶公司想要突破,还是需要通过养车队、运营,然后得到足够多的里程数和数据去反哺技术。 自动驾驶里程数需要达到数几十亿公里,就不能说是安全的。

中国的基建对L4级自动驾驶并不友好,要想达到真实的安全,需要对道路重新设计,车道数、限速、交通导流、路面结构等环环相扣。每个城市的交通信号灯不一样,还得统一信号灯的电子信号、道路结构和材质等。

四是加强产品管理。《意见》提出企业生产具有驾驶辅助和自动驾驶功能的汽车产品的,应当明确告知车辆功能及性能限制、驾驶员职责、人机交互设备指示信息、功能激活及退出方法和条件等信息。企业生产具有组合驾驶辅助功能的汽车产品的,还应采取脱手检测等技术措施,保障驾驶员始终在执行相应的动态驾驶任务。企业生产具有自动驾驶功能的汽车产品的,应当确保汽车产品至少满足系统失效识别与安全响应、人机交互、数据记录、过程保障和模拟仿真等测试验证的要求。应当确保汽车产品具有安全、可靠的时空信息服务,鼓励支持接受北斗卫星导航系统信号。——工信部不允许L2脱手驾驶hands-off

所以国内L2+ 一般定义为导航辅助驾驶 高级辅助驾驶

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值