机器人运动控制算法与结构运动学研究
在机器人领域,解决逆运动学和正运动学问题是实现精确控制和规划的关键。本文将深入探讨两种不同的方法:用于解决四连杆机械臂逆运动学问题的深度 Q 学习算法,以及用于张拉整体结构正运动学问题的线性化算法。
深度 Q 学习算法解决四连杆机械臂逆运动学问题
动态探索系数与 Q 表优化
使用动态探索系数能够减少智能体到达目标点所需的步数,进而提高在给定时间内到达目标点的概率。在训练过程中,智能体通过人工神经网络(ANN)生成 Q 表来预测能获得最大奖励的动作。传统的 Q 表构建方法存在一些问题,例如对于四连杆机械臂,一种方法需要长度为 8 的动作向量,这无法保证机械臂连杆的平滑运动,还会增加到达目标点的步数;另一种构建长度为 34(即 81 种可能动作)的向量的方法,需要在 ANN 输出层使用 81 个神经元,这会导致网络规模增大,容易出现过拟合问题。
为了提高 Q 学习算法的效率,研究人员开发了一种在机械臂连杆之间分配奖励的方法,该方法可以将输出层减少到 12 个神经元,避免了过拟合问题。Q 表由每个连杆在所有可能动作下能获得的奖励组成,智能体可以使用相对较小的向量长度来组合动作。
| Action | a1 | a2 | a3 |
|---|---|---|---|
| Link 1 | Q11 | Q12 | Q13 |
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



