具身智能入门知识(一)

具身智能入门:机器人动作执行与相关知识

一、机器人动作执行主要三种方法

在机器人学习(Robot Learning)领域,机器人动作执行主要有三种方法:包括直接回归、分类预测和生成式模型

  1. 回归

连续值问题,一个输入对应一个数值输出,不能解决多模态Multi-Modal Action问题,即一个输入可以对应多个输出。

  1. 分类预测

离散值,将可能的数值分成几个区间,进行离散预测。在预测Multi-Modal Action的时候(解决了多模态行为),人们倾向于采用离散预测,将连续值问题转化为分类问题,但这样做存在问题: 一次只能向前预测一步, 而实际需求是希望一次性预测多步动作;在处理高维空间时,预测成本非常高。

  1. 生成模型

生成模型都可以预测连续的多模态分布,但很多生成模型的问题是训练不稳定

基于Diffusion Model的生成模型方法具有一个重要的优势,即训练非常稳定, 不管怎么训,最终都能得到一个可以work的模型。

在Robot Learning领域,机器人操作比较常用的两个路径是强化学习(Reinforcement Learning)模仿学习(Imitation Learning)

二、基础术语

  1. 操作(Manipulation)和移动(Locomotion)
    移动(Locomotion):下肢操作,专注于机器人自身的运动能力,主要考虑机器人的物理特性和动力学(例如关节、足部接触力等)。移动任务通常涉及对机器人本体的建模和控制(如步态规划、平衡控制等),较少依赖外界环境中的动态变化。
    操作/操控/操纵(Manipulation):上肢操作,涉及与各种各样的物体进行交互,pick取&place放,others,每个物体都具有独特的物理特性,如重心、摩擦力和动力学。这些在模拟器中难以准确模拟,即便能够模拟,精
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值