自动驾驶决策规划研究综述录标题
摘要
实时进行路径规划是车辆能够实现自动驾驶的重要功能之一,自动驾驶车辆面对的交通场景多而复杂,因此如何根据感知层得到的车辆周边的障碍物、车流、人流信息规划出一条安全、驾乘舒适、平滑的路径是自动驾驶领域的经典难题,而服务于自动驾驶的决策规划也在近年来受到了学术界和工业界越来越多的关注。本文对该领域主要研究进展进行了综述。首先,介绍自动驾驶决策规划模块的重要作用。其次介绍规划与决策分层次的结构,以及每个层次的重要算法。最后总结实际自动驾驶的决策规划模块的典型问题,并展望这个方向的研究趋势。
关键词:自动驾驶;感知决策;路径规划;层次结构
一、自动驾驶决策感知的介绍和重要意义
决策规划是自动驾驶的核心技术,决策感知的主要任务就是要基于感知模块感知到的车辆周边状态,找到一条安全的,乘客乘坐体验舒适的,平滑的的路径,交给控制模块执行。形象的讲,决策规划就是自动驾驶的大脑。大脑在接收到传感器的各种感知信息之后,对当前环境作出分析,然后对底层控制模块下达指令。
在现有的决策和规划框架中,有两种主要系统:基于规则的决策和基于学习的决策和计划方案。基于规则的决策利用驱动规则和专家知识来确定最优逻辑行为,其代表性方法是有限状态机(FSM)[6]和马尔可夫决策过程(MDP)[8],[9]。基于学习的方法利用不同的网络结构,根据环境生成具有最佳回报的最优策略。各种基于学习的方法,如强化学习都很受欢迎。
二、自动驾驶感知决策的层次结构
一般来说,决策规划模块可以分为三个层次结构:全局路径规划,行为决策,运动规划
1全局路径规划
全局路径规划(Route Planning)在接收到一个给定的行驶目的地之后,结合地图信息,生成一条全局的路径,作为为后续具体路径规划的参考;全局规划需要我们知道目的地,是一种长期的规划,更关心高层的信息,不太关心很细枝末节上的决策。全局规划的本质是一种搜索,在优化领域就是给定约束下的最小化问题。
全局路径规划是指在给定车辆当前位置与终点目标后,通过搜索选择一条最优的路径,这里的“最优”包括路径最短,或者到达时间最快等条件。这一过程类似于我们生活中经常用到的“导航”功能,区别在于自动驾驶中使用的高精地图与我们常见的地图不太一样,在高精地图中包含了每条车道在内的更多信息。常见的全局路径规划算法包括Dijkstra和A算法,以及在这两种算法基础上的多种改进。Dijkstra算法[3]和A算法[4]也是在许多规划问题中应用最为广泛的两种搜索算法。
解决全局优化常见的代表算法有:Dijkstra、A、MDP。Dijkstra是一种广度优先搜索,因为每个节点都要探寻,所以搜索会慢;而A*及其各种衍生算法是一种启发式算法,搜索过程会朝着目的点前进,避免了一些无谓的搜索;MDP是强化学习的思路,构建环境和奖励系统,让运动对象吃亏上当后,学会精致利己,沿着目标点前进。
1.1Dijkstra算法:
Dijkstra算法是由计算机科学家Edsger W. Dijkstra在1956年提出,用来寻找图形中节点之间的最短路径。在Dijkstra算法中,需要计算每一个节点距离起点的总移动代价。同时,还需要一个优先队列结构。对于所有待遍历的节点,放入优先队列中会按照代价进行排序。在算法运行的过程中,每次都从优先队列中选出代价最小的作为下一个遍历的节点。直到到达终点为止。
Dijkstra算法的优点是:给出的路径是最优的;缺点是计算时间复杂度比较高(O(N2)),因为是向周围进行探索,没有明确的方向。
1.2 A*算法
为了解决Dijkstra算法的搜索效率问题,1968年,A算法由Stanford研究院的Peter Hart, Nils Nilsson以及Bertram Raphael发表,其主要改进是借助一个启发函数来引导搜索的过程。具体来说,A算法通过下面这个函数来计算每个节点的优先级:
其中:
f(n) 是节点n的综合优先级。当我们选择下一个要遍历的节点时,我们总会选取综合优先级最高(值最小)的节点。
g(n)是节点n距离起点的代价。
h(n) 是节点n距离终点的预计代价,这也就是A*算法的启发函数。
1.3马尔科夫算法
马尔可夫过程(简称为马氏过程)是最经典、也是应用最为广泛的一类随机过程。关于马尔可夫性的严格定义是需要一定现代概率论的基础的,涉及到有关于事件域、流、条件数学期望、自然事件域等数学概念。一般而言,面向工科及应用数学专业的《应用随机过程》中也不会涉及马氏过程的严谨定义,只有在数学专业的《随机过程》中才能找到其严谨定义。在这里,我们不详细赘述马氏过程的严谨定义,而只是介绍其直观的含义:对于一个马氏过程, 的分布只和 的取值有关,和 前面发生过的事情无关。这也就是说, 。我们可以想象,初始值是 X 1 X_1 X

本文综述了自动驾驶决策规划领域的研究进展。介绍了决策规划模块的重要作用和层次结构,包括全局路径规划、行为决策、运动规划等层次的重要算法。总结了决策规划存在的典型问题,如安全无碰撞规划、平衡长短规划关系等,并展望了与车辆动力学、机器学习结合等研究趋势。
最低0.47元/天 解锁文章
1344





