95、差分约束下的规划与采样规划方法

差分约束下的规划与采样规划方法

1. 差分约束下的规划基础
  • δ(c0, c1)-安全状态轨迹 :设tF为终止动作应用的时间。若对于所有t ∈ [0, tF],以q(t)为中心、半径为δ(c0, c1)( ˙q)的球不与工作空间W中的障碍物发生碰撞,则称该状态轨迹为δ(c0, c1)-安全的。这里球的半径随速度线性增长,可将机器人想象成一个半径由速度决定的圆盘。
  • 搜索算法与轨迹求解 :给定xI、xG、c0和c1(仅允许点目标区域),若存在一个δ(c0, c1)-安全状态轨迹,在时间topt后终止于xG。通过选择合适的t(由特定公式给出),对可达性格进行广度优先搜索,能找到一条(1 - ϵ)δ(c0, c1)-安全轨迹,其耗时最多为(1 + ϵ)topt,并近似连接xI和xG。算法运行时间在1/ϵ和定义多边形障碍物的基元数量上是多项式的。但需注意,计算得到的解不一定接近真正的最优解,可能来自与真正最优轨迹不同的同伦类。
  • 反向和双向版本 :可以通过反向时间积分得到类似于正向的可达性格,这表明了从哪些动作序列和相关初始状态可以到达一个固定状态。由于正向和反向图都存在,因此可以进行双向搜索。利用正向和反向时间受限可达锥,初始状态和目标状态可以连接到一个共同的格,例如从原点开始。
2. 欠驱动和非完整系统

许多有趣的系统由于欠驱动或其他约束,无法用具有n个独立动作变量的¨q = h(q, ˙q, u)形式表示。例如某些模型是欠驱动和非完整的,此时难以将方程转换为双积分器向量,因为U(q, ˙q)的维度

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值