宇树科技(Unitree)开源了“世界模型-动作架构”——UnifoLM-WMA-0。

UnifoLM-WMA-0让机器人拥有了“举一反三”和“预判”的能力。机器人不再是一个只会执行代码的铁疙瘩,而是开始拥有了一个能理解世界运转规律的“认知内核”。
宇树官方定义:“UnifoLM-WMA-0 是宇树科技跨多类机器人本体的开源世界模型-动作架构,专为通用机器人学习而设计。其核心成分在于一个可以理解机器人与环境交互物理规律的世界模型。”
UnifoLM-WMA-0通过一种叫做“神经物理网络”(Neural-Physics Networks)的技术,去学习并建模真实世界里的那些我们从初中就开始接触的力学规律,比如重力、摩擦力、还有那无处不在的碰撞。这就好比给机器人装上了一个“物理引擎”,它能高精度地预测环境的动态变化,并以此为依据,做出最优的动作决策。
给机器一个能理解世界的“大脑”
要理解UnifoLM-WMA-0,我们先聊两个概念:“世界模型”和“通用机器人”。
“世界模型”(World Model)在人工智能领域,指的是一种能模拟环境动态、预测未来的计算框架。你可以把它想象成我们人类大脑里的“认知沙盘”。比如你开车时,你不仅看到了前面的车,你大脑里的“世界模型”还会告诉你,那辆车可能会减速,旁边的行人可能会过马路。你根据这些“预判”来调整自己的驾驶行为。这个“认知沙盘”就是你的世界模型,它让你能预见自己行为的后果,从而做出更聪明的决策。
传统的机器人,像是一个只有导航地图的司机,地图上说这里有个路口,它就准备转弯,但如果路口突然冲出来一个皮球,它可能就懵了,因为“规则”里没写这一条。数据驱动的黑箱模型稍微好一点,它可能见过类似的场景,知道要刹车,但它并不“理解”为什么,它只是记住了“看到球就刹车”这个模式,

最低0.47元/天 解锁文章

977

被折叠的 条评论
为什么被折叠?



