一、机器人动作执行主要三种方法
在机器人学习(Robot Learning)领域,机器人动作执行主要有三种方法:包括直接回归、分类预测和生成式模型。
- 回归
连续值问题,一个输入对应一个数值输出,不能解决多模态Multi-Modal Action问题,即一个输入可以对应多个输出。
- 分类预测
离散值,将可能的数值分成几个区间,进行离散预测。在预测Multi-Modal Action的时候(解决了多模态行为),人们倾向于采用离散预测,将连续值问题转化为分类问题,但这样做存在问题: 一次只能向前预测一步, 而实际需求是希望一次性预测多步动作;在处理高维空间时,预测成本非常高。
- 生成模型
生成模型都可以预测连续的多模态分布,但很多生成模型的问题是训练不稳定。
基于Diffusion Model的生成模型方法具有一个重要的优势,即训练非常稳定, 不管怎么训,最终都能得到一个可以work的模型。
在Robot Learning领域,机器人操作比较常用的两个路径是强化学习(Reinforcement Learning)和模仿学习(Imitation Learning)。
二、基础术语
- 操作(Manipulation)和移动(Locomotion)
移动(Locomotion):下肢操作,专注于机器人自身的运动能力,主要考虑机器人的物理特性和动力学(例如关节、足部接触力等)。移动任务通常涉及对机器人本体的建模和控制(如步态规划、平衡控制等),较少依赖外界环境中的动态变化。
操作/操控/操纵(Manipulation):上肢操作,涉及与各种各样的物体进行交互,pick取&place放,others,每个物体都具有独特的物理特性,如重心、摩擦力和动力学。这些在模拟器中难以准确模拟,即便能够模拟,精
具身智能入门:机器人动作执行与相关知识

最低0.47元/天 解锁文章
1456

被折叠的 条评论
为什么被折叠?



