感知不确定性下的规划策略解析
1. 信息反馈规划与环境探索
在未知环境探索中,若存在特殊物体可被机器人探测到,有一种策略能确保机器人找到该物体,即便最后它可能都没有完整的地图。这种方法可视为信息空间(I - space)上的信息反馈规划。在这种规划里,Blum 和 Kozen 提出的策略如同一个万能“规划器”,能解决任何问题,无需根据具体问题数据重新计算替代方案,因为该策略能无修改地应对所有可能环境,这体现了直接在环境集的信息空间上工作的强大之处,而不是依赖状态估计。
2. Stentz 算法(D∗)
2.1 算法背景与应用场景
想象用机器人车辆探索未知行星。机器人在崎岖地形移动,用距离扫描仪精确测量周围地面情况。移动过程中,它可能发现某些区域比预想容易通行,也可能遇到因巨石或沟壑无法前进的方向。若目标是到达指定坐标,这就是一个未知环境下的导航问题,而 Stentz 算法就是解决此类问题的有效方法,它已广泛应用于许多户外车辆导航场景,如自动化越野无人车(XUV)。
2.2 算法原理
Stentz 算法可看作 Dijkstra 算法反向变体的动态版本。它维护从目标向外扩展的“到目标代价”(cost - to - go)值,而非从初始状态 $x_I$ 计算的“到当前代价”(cost - to - come)值。该算法适用于任何最优规划问题,在状态转移图中,假设边转移的代价未知,即每个 $l(x, u)$ 未知。在导航问题中,正代价表示从状态 $x$ 到状态 $x’ = f(x, u)$ 的通行难度。
为便于理解,假设行星表面被划分为高分辨率网格,状态空间 $X$ 是有界的网格瓦片集合,即 $X
超级会员免费看
订阅专栏 解锁全文
2654

被折叠的 条评论
为什么被折叠?



