MURPHY的视觉引导伸手学习算法详解
1. 引言
MURPHY是一款专为研究视觉引导的多连杆手臂运动规划而设计的机器人系统。它通过学习算法,不仅能够理解其手臂在工作空间中的位置,还能通过视觉信息来规划手臂的运动路径,以避开障碍物并达到目标。本文将深入探讨MURPHY的学习算法,特别是它如何通过实践学习来建立前向运动学映射,并使用这些映射生成手臂的心智图像,从而有效地进行运动规划。
2. 学习机制
MURPHY的学习机制主要依赖于sigma-pi单元,这是一种通过乘法连接来计算的简单连接主义单元。与传统的反向传播算法不同,sigma-pi单元通过计算输入信号的乘积来逼近教师函数。这种方式不仅提高了学习效率,还使得算法能够更好地适应实际应用中的复杂环境。
2.1 Sigma-Pi单元的结构与功能
Sigma-pi单元的基本结构如下图所示:
graph TD;
A[输入单元1] --> B[Sigma-Pi单元];
C[输入单元2] --> B;
D[输入单元3] --> B;
B --> E[输出单元];
每个sigma-pi单元接收多个输入信号,并通过计算这些输入信号的乘积来生成输出。这种结构使得MURPHY能够在多维空间中进行高效的学习和推理。
2.2 学习过程
MURPHY的学习过程主要包括两个阶段:初始训练和后续的“心理”练习。在初始训练阶段,MURPHY通过在摄像头前挥动手臂来学习手臂的运动学特性。在此过程
超级会员免费看
订阅专栏 解锁全文
54

被折叠的 条评论
为什么被折叠?



