机器人学习:操控机械臂与语音交互
1. 机器人机械臂的机器学习方法
1.1 编程与参数调整
编程难度不算高,我们可以花些时间调整遗传算法的参数来改进过程。比如,尝试更小的种群规模,或者改变适应度标准,通过不断尝试来探索更多可能。
1.2 其他研究方向
1.2.1 开发与探索的平衡
在理解机器人运动时,要考虑开发与探索的平衡。开发是让机器人尽快达到目标,探索则是利用机器人周围的空间尝试新事物。路径规划程序可能会陷入局部最优,而忽略了更好的解决方案。
1.2.2 示范学习
除了自我探索式的训练,还可以让机器人通过观察人类执行相同任务来学习,即示范学习。
1.3 Google的SAC - X方法
Google针对机械臂问题采用了不同的方法。在SAC - X(Scheduled Auxiliary Control)程序中,他们认为为机械臂的每个动作分配奖励点很困难。因此,将复杂任务分解为较小的辅助任务,并为这些支持任务分配奖励点,让机器人逐步应对复杂挑战。例如,用机械臂堆叠积木时,可将拿起积木、手持积木移动等分别作为不同任务。若只对堆叠积木这一主要任务进行强化学习,会面临“稀疏奖励”问题,即机器人可能要经历数千次失败尝试才能获得一次成功奖励。
1.4 亚马逊机器人挑战赛
亚马逊拥有大量商品,他们希望将货架上的物品快速放入小盒子以便发货。为此,亚马逊举办了机器人挑战赛,邀请大学团队使用机械臂从货架上拾取物品并放入盒子。由于亚马逊销售的商品种类繁多,这是一项极具挑战性的任务。2017年,澳大利亚昆士兰的一个团队
超级会员免费看
订阅专栏 解锁全文
2099

被折叠的 条评论
为什么被折叠?



