WholeBodyVLA——全身行走-操作控制的统一潜在VLA:基于从无标注视频中学习行走/操作的LAM,和专门面向loco–mani的RL策略LMO,让智元灵犀X2稳定搬箱子
《WholeBodyVLA:面向人形机器人的行走-操作统一框架》摘要 本文提出WholeBodyVLA框架,解决人形机器人行走-操作任务中的关键挑战。通过统一潜在学习(unified latent learning)方法,分别训练行走和操作的潜在动作模型(LAM),从人类视频中获取先验知识,并联合监督视觉语言动作(VLA)模型。针对底层控制问题,设计了面向行走-操作的强化学习策略(LMO),采用离散指令接口替代传统速度跟踪,通过两阶段训练提升运动精度和稳定性。实验表明,该框架能实现大空间环境中的端到端行走-





