反馈运动规划全解析:从离散空间到连续空间的探索
在运动规划领域,反馈运动规划正逐渐展现出其重要性。它不仅能为机器人等设备提供可靠的运动方案,还能在面对不确定性时表现出更强的适应性。本文将深入探讨反馈运动规划的相关知识,从离散状态空间入手,逐步介绍反馈计划的定义、可行性与最优性,以及如何将其表示为导航函数,最后探讨基于网格的导航函数在运动规划中的应用。
1. 反馈运动规划概述
反馈运动规划在机器人技术的解耦方法中是一个重要模块。与传统运动规划算法计算出的开环路径相比,反馈运动规划的解决方案通常更加可靠。它能指示如何从任意顶点最优地到达特定顶点,这为后续的运动规划提供了基础。
2. 离散状态空间中的反馈规划
2.1 反馈计划的定义
考虑一个离散规划问题,与常见规划问题不同的是,这里初始状态未给定。因此,成本泛函不能仅表示为计划的函数,而是由状态历史和动作历史来定义。
在阶段 $k$ 时,状态历史 $\tilde{x}_k = (x_1, x_2, \ldots, x_k)$,动作历史 $\tilde{u}_k = (u_1, u_2, \ldots, u_k)$。
离散最优反馈规划的构成要素如下:
1. 有限非空的状态空间 $X$。
2. 对于每个状态 $x \in X$,有一个有限的动作空间 $U(x)$。
3. 状态转移函数 $f$,对于每个 $x \in X$ 和 $u \in U(x)$,能产生一个状态 $f(x, u) \in X$,设 $U$ 为所有 $x \in X$ 的 $U(x)$ 的并集。
4. 一组阶段,每个阶段用 $k$ 表示,从 $
反馈运动规划:从离散到连续
超级会员免费看
订阅专栏 解锁全文
49

被折叠的 条评论
为什么被折叠?



