具身智能数采方案:全身动捕工作一览

部署运行你感兴趣的模型镜像

最近很多同学咨询我们全身动捕数据的方案,相比于遥操作/VR+动捕手套,这种方案技术难度上更大,今天也为大家汇总几篇行业里面比较知名的全身动捕方案。更多内容欢迎移步到具身智能之心知识星球,一个交流技术和方案的地方。

OpenWBC

项目链接:https://github.com/jiachengliu3/WBC_Deploy

本项目实现了对 Unitree G1 机器人的全身控制:使用 Apple Vision Pro 结合avp_teleoperate控制机器人上半身,使用OpenHomie算法控制下半身运动。同时支持全身数据采集功能。

主要功能特性:

  • 双模式控制: 上半身远程操控 + 下半身自主行走

  • 实时控制: 基于 Apple Vision Pro 的低延迟控制

  • 全身数据采集: 支持完整的机器人动作数据收集

  • 模块化设计: 可独立部署上半身或下半身控制

  • 跨平台通信: TCP/IP 网络通信架构

TWIST

TWIST: Teleoperated Whole-Body Imitation System

项目链接:https://yanjieze.com/TWIST/

斯坦福大学团队出品的工作。全身远程操控人形机器人标志着迈向通用机器人智能的关键一步,而人体运动为控制所有自由度提供了理想接口。然而,当前大多数人形机器人遥操作系统难以实现协调的全身行为,通常仅限于孤立的移动或操作任务。团队提出"全身运动模仿遥操作系统"(TWIST),该系统通过全身运动模仿实现人形机器人远程操控。首先通过将人体动作捕捉数据重定向至人形机器人来生成参考运动片段,随后结合强化学习与行为克隆(RL+BC)开发出鲁棒、自适应且响应灵敏的全身控制器。通过系统分析,我们证明了引入特权未来运动帧和真实世界动作捕捉(MoCap)数据如何显著提升跟踪精度。TWIST使人形机器人在现实世界中仅通过单一神经网络控制器,即可实现前所未有的、多功能的、协调的全身运动技能——涵盖全身操作、腿臂协同操作、移动以及富有表现力的动作。

AMO

AMO: Adaptive Motion Optimization for Hyper-Dexterous Humanoid Whole-Body Control

项目链接:https://amo-humanoid.github.io/

加利福尼亚大学圣迭戈分校团队出品。人形机器人卓越的灵巧性主要源于其超灵活的全身运动能力,这种能力使其能够执行需要大范围工作空间的任务——例如从地面拾取物体。然而,由于高自由度(DoF)和非线性动力学特性,在真实人形机器人上实现这些能力仍面临重大挑战。团队提出自适应运动优化框架(AMO),该框架将仿真到现实的强化学习(RL)与轨迹优化相结合,实现实时自适应的全身控制。为缓解运动模仿强化学习中的分布偏差问题,我们构建了混合型AMO数据集,并训练出能够对潜在分布外(O.O.D)指令进行鲁棒按需适应的网络。通过在仿真环境和29自由度的Unitree G1人形机器人上进行验证,AMO展现出相较于基线方法的卓越稳定性及扩展的工作空间。最终实验表明,AMO的稳定性能通过模仿学习支持自主任务执行,充分验证了该系统的多功能性与鲁棒性。

OpenWBT

清华大学&银河通用团队出品,论文:Unleashing Humanoid Reaching Potential via Real-world-Ready Skill Space

项目链接:https://github.com/GalaxyGeneralRobotics/OpenWBT

该仓库实现了使用 Apple Vision Pro 对宇树(Unitree)G1 和 H1 人形机器人进行全身遥操作控制,该系统不仅支持实机也能使用户在仿真中遥操,基于该系统只需要一个遥操员就可以控制机器人像人一样运动、蹲、弯、抓,搬等,大幅度扩展了机器人作业空间以实现更多任务。

在这个项目中,遥操作可分为下半身控制与上半身控制两部分。针对下半身控制,方法允许使用者通过一对摇杆控制器来操控人形机器人行走或改变身体姿态。而上半身控制方面,机器人手部动作是通过逆向运动学算法,从VR设备捕捉到的人手位姿数据计算得出的。

基于R2S2工作:

人类在三维世界中具备广阔的交互空间,能够灵活触及不同高度和距离的物体。然而,人形机器人要实现这种大范围触达能力,需要解决复杂的全身协同控制问题——包括基座定位与转向、高度与体态调整、末端执行器姿态控制等多项技能的同步掌握。传统从零开始的训练方法往往面临优化困难与仿真-现实迁移性差的瓶颈。为此,团队提出"Real-world-Ready Skill Space"(R²S²)框架:首先构建由现实可用基础技能组成的精调技能库,通过逐项技能优化与仿真-现实验证确保最优性能与强健的迁移性;继而将这些技能集成至统一潜空间,形成可高效执行任务且具备迁移特性的结构化先验知识;最终通过训练高层规划器从该空间采样技能,使机器人完成现实世界中的目标触达任务。实验证明,R²S²在点触式交互与箱体抓取等挑战性场景中实现了零样本的仿真-现实迁移。

Clone

Clone: Closed-Loop Whole-Body Humanoid Teleoperation for Long-Horizon Tasks

项目链接:https://humanoid-clone.github.io/

北京理工大学等团队出品。人形机器人遥操作在演示和采集复杂人机环境交互数据方面具有关键作用。然而现有系统存在两大局限:为维持稳定性将上下肢控制解耦,限制了自然协调性;采用开环控制且缺乏实时位姿反馈,导致误差累积。核心挑战在于如何实现长时间精确协调的全身遥操作,同时保持全局定位准确性。本研究提出的基于混合专家(MoE)的闭环纠错系统CLONE,仅通过MR头显的头手追踪即可实现前所未有的全身操作保真度,在长距离移动中保持极低的位置漂移。与以往要么牺牲协调性求稳定、要么面临无界漂移的方法不同,CLONE通过实时反馈机制在学习多样化运动技能的同时抑制误差累积,可完成"从地面拾取物体"等复杂协调动作。这一成果为长期人机环境交互任务中的全身遥操作树立了新标杆。

更多内容

更多内容欢迎移步到国内首个具身智能全栈学习社区:具身智能之心知识星球。

具身智能之心知识星球,截止到目前已经完成了产业、学术、求职、问答交流等多个领域的闭环。几个运营的小伙伴每天都在复盘,什么样的社区才是大家需要的?花拳绣腿的不行、华而不实的不行、没人交流的也不行、找不到工作的更不行。

于是我们就给大家准备了学术领域最前沿的内容、大佬级别圆桌、开源的代码方案、最及时的求职信息......

星球内部为大家梳理了近30+技术路线,无论你是要找benchmark、还是要找综述和学习入门路线,都能极大缩短检索时间。星球还为大家邀请了数十个具身领域嘉宾,都是活跃在一线产业界和工业界的大佬(经常出现的顶会和各类访谈中哦)。欢迎随时提问,他们将会为大家答疑解惑。

除此之外,还为大家准备了很多圆桌论坛、直播,从本体、数据到算法,各类各样,逐步为大家分享具身行业究竟在发生什么?还有哪些问题!

星球还和多家具身公司建立了岗位内推机制,欢迎大家随时艾特我们。第一时间将您的简历送到心仪公司的手上。

针对入门者,我们整理了许多为小白入门的技术栈和路线。

已经从事相关研究的同学,我们也给大家提供了很多有价值的产业体系和项目方案。

这里是一个认真做内容的社区,一个培养未来领袖的地方。欢迎加入我们,和我们一起共建行业。

您可能感兴趣的与本文相关的镜像

Qwen3-14B

Qwen3-14B

文本生成
Qwen3

Qwen3 是 Qwen 系列中的最新一代大型语言模型,提供了一整套密集型和专家混合(MoE)模型。基于广泛的训练,Qwen3 在推理、指令执行、代理能力和多语言支持方面取得了突破性进展

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值