机器人学习与知识获取:贝叶斯网络、ProbLog与马尔可夫逻辑的应用
1. 基于可供性的模型
在机器人学习领域,基于可供性的模型是一个重要的研究方向。可供性捕获了环境中的行动机会,例如一个物体可以被用来做什么。典型的设置包括一个带有机械臂的机器人和一张放置着物理对象(如立方体、球等)的桌子。该方法主要涉及三个方面:行动(A)、对象属性(O)和效果(E)。
- 行动(A) :包括抓取(和释放)、推动(在远离机器人的平面上)和轻拍(侧向)等物理操作技能。
- 对象属性(O) :可以通过感知设备(如视觉)测量的方面,包括颜色、形状和大小。
- 效果(E) :执行行动后可测量的特征变化,例如手的速度、手与对象之间的速度(或距离)等。
这些方面及其关系如图1所示:
| 元素 | 描述 |
| ---- | ---- |
| 行动(A) | 物理操作技能,如抓取、推动、轻拍 |
| 对象属性(O) | 颜色、形状、大小等 |
| 效果(E) | 手的速度、手与对象的距离等变化 |
学习模仿操作行动通过以下步骤完成:
1. 收集机器人对不同对象执行多个行动的数据。
2. 对每次演示测量A、O和E的所有特征,然后进行处理、离散化和聚合,以获取一个数据集,其中所有特征具有相对较小的(有序)值集。
3. 学习一个概率模型,捕获这三种类型特征之间的依赖关系。
4. 该模型可用于各种目的,例如模仿学习。机器人观察人类操作对象(具有属性O),观察演示行动的效果(E),并计算最
超级会员免费看
订阅专栏 解锁全文
1458

被折叠的 条评论
为什么被折叠?



