31、室内环境移动机器人导航的发展式机器人范式

室内环境移动机器人导航的发展式机器人范式

1. 引言

在机器人领域,终极的长期目标是构建一个能通过与环境交互,以自主开放式方法逐步发展新技能的机器人系统,且无需预先设计特定任务的表示。然而,传统机器学习算法通常采用特定任务的方法,难以应对不受控环境的动态变化。为填补机器无法从传统机器学习和人工智能技术中受益的空白,自主心理发展(AMD)这一相对较新的研究领域应运而生。

Weng及其同事指出,心理发展过程必须能够直接从原始感官信号在线自主生成表示和架构,并且不针对特定任务。传统工程(手动开发)范式与提出的心理发展范式存在明显差异,具体如下表所示:
| 程序属性 | 传统程序 | 发展式程序 |
| — | — | — |
| 传感器特定和执行器特定 | 是 | 是 |
| 程序非任务特定 | 否 | 是 |
| 编程时任务未知 | 否 | 是 |
| 自动生成表示 | 否 | 是 |
| 类似动物的在线学习 | 否 | 是 |
| 开放式学习更多新任务 | 否 | 是 |

与只能接受一系列固定大小离线感官数据向量的传统人工神经网络不同,在现实物理世界中运行的发展式机器人能够在线添加从未见过的新数据。它可以为许多不同类型的任务发展简单的基本技能,并利用这些技能学习更复杂的技能。例如,人类儿童的大脑不是在一次训练中手动用数据训练的,而是父母通过认可或否定行为不时教导。为了在真实、无约束、高度复杂和动态的世界中运行,发展式机器人应通过与环境和用户的师生关系进行训练,因此开放式发展系统是必要的。

任务的复杂性可被视为五个类别复杂性度量的乘积,包括外部环境、输入、内部环境、输出和目标。感知作为

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值