宇树机器人成赛博科比!英伟达CMU新研究,投篮模仿篮球巨星,代码论文全开源...

部署运行你感兴趣的模型镜像
明敏 发自 凹非寺
量子位 | 公众号 QbitAI

你以为的宇树机器人(H1):

51c4d0aca1b5134d43c89b637fa9e90b.gif

实际上的宇树机器人(G1):轻松来一个帅气的科比投篮。

26b85c52db109bc4dd2e2b9090fbc441.gif

或者是像罗纳尔多那样华丽旋转跳跃。

3d5c24b2714f646cc310a91dda70a491.gif

英伟达卡内基梅隆大学一起,给宇树机器人“一雪前耻”了(doge)。

只通过一个训练框架,机器人就能成为“学人精”,完成各种高难度敏捷动作。

从这样(下左图)变成这样(下右图)。

b94cc544fd1c481e6bb943e3990ab367.gif

左图演我做运动

要知道,由于仿真环境和真实物理世界之间的动力学系统存在偏差,让机器人敏捷、协调地完成各种类人动作仍旧是一个巨大挑战。

ASAP方法解决的正是这个问题,论文和代码通通开源

有人感慨,看来机器人时代距我们只有几步之遥。

d34f5c14b464c0f09d060090817ccb11.png

主创之一Jim Fan也表示:期待2030年“人形”奥运会吧。

2064a6701f78a2cca4f23ae1a0ba2d30.png

显著提高机器人灵活性和全身协调性

简单总结论文核心提出了ASAP(Aligning Simulation and Real Physics,对齐模拟与真实物理)。

46dae0b2e45c4056e4c29323917903af.gif

这个框架主要分为两个阶段。

第一阶段,使用经过调整的人类运动数据在模拟环境中预训练运动跟踪策略。

第二阶段,将这些策略应用到真实世界,并收集真实数据来训练一个“残差”动作模型,用来弥补模型与真实世界物理动态之间的差距。

然后ASAP将预训练的策略与差异动作模型结合,并在模拟器中进行微调,以便更好地与真实世界物理动态对接。

98c3e3b5b92d736a4ba39dee8e4ee260.png

具体步骤分为四步:

1、运动跟踪预训练与真实轨迹收集:通过将人类视频中的运动数据转换为类人机器人动作,我们在模拟环境中预训练多个运动跟踪策略,并生成真实世界的运动轨迹。

01984609bcec636e19ea89a8bcf66043.png

2、差异动作模型训练:基于真实世界的运动数据,我们训练一个“差异动作模型”,通过最小化模拟状态(s_t)和真实世界状态(s^r_t)之间的差距来进行优化。

66cf37df97de9abe0e09618778fc4b44.png

3、策略微调:我们固定差异动作模型,并将其集成到模拟器中,以调整模拟和真实物理之间的匹配,然后微调之前训练好的运动跟踪策略。

4、真实世界部署:最后,我们将微调过的策略直接应用到现实世界中,不再需要差异动作模型。

研究人员在三个迁移场景中评估了ASAP的效果——
从IsaacGym到IsaacSim、从IsaacGym到Genesis,以及从IsaacGym到真实世界。

使用的机器人是宇树G1人形机器人。

d5c2c7ff4c931beb2dab308b6891c7fc.png

如上是从IsaacGym到IsaacSim,G1踢足球的四种不同动作。值得一提的是,ASAP在多个动作中训练,不会过拟合特定示例。

eecc874bd802d92373782014da72f982.png

从IsaacGym到IsaacSim,从IsaacSim到真实世界,ASAP微调前后G1运动跟踪表现如上。

在特定动作(詹姆斯消音步)上,可以看到使用ASAP后,机器人的稳定性更好了。

4e991d5c4b5e3fb22ec60dd9c147d444.png

由此可以看到,G1能够完成横款大跳等有难度的运动动作,在姿态上也和人类更为贴近。

e1ab73cb2ac50f997c2191b4f1e07ab1.gif

四位华人共同一作

最后来看下研究团队阵容。

5a6aced955dfb9444fdcafa90b1ba548.png

18位作者中绝大多数都是华人面孔。

共同一作有四位,分别是何泰然、高嘉伟、Wenli Xiao和Yuanhang Zhang。

其中何泰然本科毕业于上海交通大学,现在是英伟达GEAR的一员,之前还在MSRA实习过。

高嘉伟本科毕业于清华大学,现在还在申请博士。

Wenli Xiao也是英伟达GEAR的一员。Yuanhang Zhang本科毕业于上海交通大学,现在在CMU读研。

One More Thing

虽然动作表现更拟人了,但是宇树机器人还是没逃过跳舞的命运……

请欣赏宇树版APT。

(统治人类后又多了一段要删除的黑历史)

项目地址:
https://agile.human2humanoid.com/

您可能感兴趣的与本文相关的镜像

LobeChat

LobeChat

AI应用

LobeChat 是一个开源、高性能的聊天机器人框架。支持语音合成、多模态和可扩展插件系统。支持一键式免费部署私人ChatGPT/LLM 网络应用程序。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值