混合定向概率运动基元及其在姿态轨迹规划中的应用
在机器人的姿态轨迹规划领域,传统的概率运动基元(ProMPs)在处理期望途经点与参考轨迹偏差较大的情况时,存在规划效果不佳的问题。为了解决这一问题,混合定向概率运动基元(Mixed Orientation ProMPs)模型应运而生。本文将详细介绍该模型的原理、算法以及实验验证。
1. 定向概率运动基元(Orientation ProMPs)训练
在训练定向概率运动基元模型时,需要计算损失函数 $E (p, w_m)$ 的近似梯度,其公式如下:
$$
\nabla_pE (p, \omega_m) \approx - \sum_{t=1}^{T} \Gamma_{\hat{y} t \to p} \log \hat{y}_t (y_t)
$$
$$
\nabla {\omega_m}E (p, \omega_m) \approx - \sum_{t=1}^{T} \varphi_{t,m} \Gamma_{\hat{y}_t \to p} \log \hat{y}_t (y_t)
$$
通过迭代计算上述公式,可以得到每个示教轨迹 $n$ 的向量 $p_n$ 和权重矩阵 $W_n$。需要注意的是,估计的权重向量 $w$ 位于点 $p$ 的切空间上。由于不同示教轨迹的估计点 $p$ 会有所不同,因此每个示教轨迹的切空间也不同。不过,通常收集的多个示教轨迹非常相似,所以可以假设所有示教轨迹共享同一点 $p$ 的切空间。这样,定向概率运动基元模型的训练只需要估计单个示教的点 $p$,然后用该点来估计所有示教轨迹的切空间权重向量。
超级会员免费看
订阅专栏 解锁全文

65

被折叠的 条评论
为什么被折叠?



