63、GLiDE:基于质心模型的可泛化四足机器人运动控制

GLiDE:基于质心模型的可泛化四足机器人运动控制

在机器人运动控制领域,模型预测控制(MPC)和强化学习(RL)是实现足式运动的两种重要方法。传统的无模型强化学习通常依赖高精度的物理模拟器来预测机器人各自由度的行为,而MPC则常使用近似的降阶模型。本文将介绍一种名为GLiDE的方法,它摒弃了在强化学习中使用高精度模型的传统做法,转而探索使用更简单的质心模型进行四足机器人运动控制的可能性。

1. 研究背景与核心贡献

近年来,足式运动在MPC和RL方法的推动下取得了显著进展。MPC利用现代优化技术和已知的物理模型,能在运行时合成响应式控制,但容易陷入局部最优,需要大量手动调整,且难以推广到复杂地形和丰富感知流。而无模型的RL方法通过蒙特卡罗采样策略学习通用任务的策略,但需要精确的系统建模、大量的离线模拟和精心设计的奖励函数。

GLiDE方法的核心贡献如下:
- 引入适用于质心动力学模型的RL框架 :该框架能够实现四足运动和平衡任务所需的预期行为,是需要精确全身体动力学模型的RL方法的有前景替代方案。使用质心模型的好处包括简单的奖励设计、训练期间高效的模拟以及灵活和鲁棒的运动控制。
- 提出新颖的四足RL动作空间 :该动作空间在机器人的质心模型中操作,通过二次规划和雅可比转置等控制方法实现质心动作空间和关节动作空间之间的转换。
- 验证方法的有效性 :通过解决多种步态的运动、踏脚石场景、平衡木运动和双足平衡等任务,证明了该方法的有效性,并成功将策略转移到物理机器人上。

2. 相关工作对比

为了更好地

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值