12、基于预测序列学习的机器人示教学习

基于预测序列学习的机器人示教学习研究

基于预测序列学习的机器人示教学习

1. 引言

在机器人示教学习(LFD)领域,预测序列学习(PSL)算法是一种重要的方法。传统的PSL算法在处理高维数据时会遭遇组合爆炸问题,为此提出了模糊预测序列学习(FPSL)算法。FPSL基于模糊逻辑规则库,能在连续状态空间中工作,相比离散状态空间的原始PSL算法,性能有显著提升。

LFD旨在让机器人通过模仿教师的示范动作来学习新行为。这面临着诸多挑战,比如如何实现一个学习算法,使机器人能将教师示范的动作序列进行泛化,从而在动态环境中执行所需行为。LFD问题常被归纳为四个问题:模仿什么、如何模仿、何时模仿以及模仿谁,这进而引出了如何评估模仿效果的大问题。

从模仿层次来看,存在多种不同的模仿级别。Byrne和Russon确定了动作级模仿(复制行为表面)和程序级模仿(复制行为结构)两个层次;Nehaniv和Dautenhahn引入了效果级模仿,以更好描述不同身体结构主体间的模仿;Demiris和Hayes则提出了基本模仿(类似动作级模仿)、功能模仿(对应效果级模仿)和抽象模仿(基于主体内部状态协调而非观察到的行为)三个层次。

在实际的LFD中,考虑模仿层次十分必要。因为两个看起来差异很大的数据序列,可能在抽象层面实现了相似结果,人类会将其视为同一行为的示例,但要找出这些示范之间的相似性却很困难,往往需要特定领域的系统。此外,同一行为的两次示范可能长度不同,研究人员常使用动态时间规整等技术来确定示范的时间对齐。

行为示范给机器人的方式有多种,Argall等人概括为四种:直接记录传感器刺激、关节角度等的身份记录映射;外部观察的非身份记录映射。教师与学生机器人的身体结构可能相同(身份体现)或不同(非身份体现),非

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值