49、运动规划与反馈规划的深入解析

运动规划与反馈规划的深入解析

1. 插值与连续动作空间

在运动规划中,重心细分法可以将每个立方体划分为单纯形,这样插值操作的时间复杂度能从 $O(2^n)$ 降低到 $O(n \lg n)$。插值区域 $R(S)$ 对于一组采样点 $S$ 而言,当且仅当 $x$ 的所有插值邻居都在 $S$ 中时,$x \in R(S)$。若使用采样网格来近似 $G^*$,随着采样分辨率的提高,$X \setminus R(S)$ 的体积会趋近于零。

当动作空间 $U(x)$ 为连续空间时,动态规划递推式(8.56)保持不变,但此时最小化操作面临着不可数无限选择的优化问题。解决方法有两种:
- 非线性优化技术 :选择最优的 $u \in U(x)$,但其效果严重依赖于 $U(x)$、$X$ 和成本函数。
- 采样评估 :从 $U(x)$ 中抽取有限样本集来评估(8.56),最好选择能最大程度降低离散度的样本。在某些情况下,可通过利用成本 - 到 - 目标函数的性质及其插值表示来排除部分动作。

2. 反馈运动规划的关键要素

要使用值迭代法解决运动规划问题,需考虑以下几个关键方面:
|序号|关键要素|具体内容|
| ---- | ---- | ---- |
|1|动作空间有界|为了用有限样本集近似 $U(x)$,需对其进行限制,可将动作集限制为 $U(x) = {u \in R^n | |u| \leq 1}$。为提高性能,有时可仅使用 $|u| = 1$ 或 $u = 0$ 的 $u$,但可能会出现数值不稳定问题。有限样本集应具有低离散度且包含 $u

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值