机器人世界模型,TeleAI用少量数据完成训练 | NeurIPS 2024

TeleAI 投稿
量子位 | 公众号 QbitAI

引言:TeleAI 李学龙团队提出具身世界模型,挖掘大量人类操作视频和少量机器人数据的共同决策模式。

当你在绿茵场上进行一场紧张刺激的足球比赛时,大脑会像一位精明的导演,不断地在脑海中预演着比赛的下一步发展。你会想象如何带球突破对方防线、如何与队友配合制造进球机会等。

这种内心的想象是基于丰富的比赛经验、对足球规则的深刻理解以及对队友特点的熟悉。

大脑能够迅速从记忆中提取信息,结合当前的比赛状况,预测未来可能出现的场景,并以近乎动画的形式在脑海中迅速闪现,帮助人类做出更好的决策

正如足球比赛中展现的一样,大脑的预演能力实际上是一个精简版的“世界模型”,通过模拟未来可能发生的情景来指导人类行为。

受此启发,具身智能研究中有望通过构建类似的“视频预测模型”作为机器人“世界模型”,通过历史序列和实时观测,预测未来可能发生的事件,形成对机器人未来行为的视频预测。

世界模型给机器人提供了一个“内心预演”的工具,能够在实际采取行动之前评估可能的行动方案及后果,帮助机器人进行决策。

近期,中国电信集团CTO、首席科学家、中国电信人工智能研究院(TeleAI)院长李学龙教授带领团队基于长期以来在扩散噪声、正激励噪声、张量噪声等噪声分析的基础上,对具身世界模型构建中的样本效率难题进行了深入研究,在少样本驱动的具身世界模型构建方面迈出了重要的一步。</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值