机器人学习中的约束控制与数据库获取方法
1. 硬约束机器人迭代学习控制方法
在机器人控制领域,对于硬约束机器人操纵器使用迭代学习控制(ILC)方法时存在诸多问题。而提出的约束输出迭代学习控制算法(COILC)是一种新颖且计算高效的通用解决方案。
COILC算法考虑了系统的关节约束,成功克服了ILC方法在约束系统控制中存在的主要缺陷,同时解决了瞬态增长问题。该算法采用了修改后的学习更新律,并引入了特殊的停止条件,从而实现了计算上的有效性。以下是其优势总结:
|优势|描述|
|----|----|
|考虑关节约束|有效处理系统的关节约束问题|
|克服主要缺陷|解决ILC方法在约束系统控制中的不足|
|解决瞬态增长|避免了瞬态增长带来的控制问题|
|计算有效|采用特殊更新律和停止条件,提高计算效率|
2. 机器人学习中的数据库获取
为了提高现代多自由度高复杂度机器人的自主性,机器人需要具备学习和适应技能的能力,强化学习(RL)是常用的方法之一。然而,RL的性能很大程度上取决于任务的维度。为了降低任务维度,常采用深度自编码器神经网络等降维技术。但基于神经网络的降维方法需要大量的示例数据库进行训练,而获取真实机器人的数据库是一个复杂且繁琐的过程。
提出了一种基于少量真实世界示例和统计泛化的方法来获取深度自编码器网络训练所需的数据库。以机器人投掷任务为例,比较了使用仅模拟数据库和泛化真实世界示例数据库的方法。
2.1 相关背景知识
- 学习方式 :目前机器人获取新技能的常用方法是示教学习(LbD)和
超级会员免费看
订阅专栏 解锁全文
20

被折叠的 条评论
为什么被折叠?



