OK-Robot机器人实现零样本算法可在非结构化环境下完成拾取与放置任务

xwz小王子

已于 2024-12-10 19:20:02 修改

阅读量1k

点赞数 7

分类专栏：机器人强化学习及自动驾驶文章标签：机器人人工智能

于 2024-02-14 08:47:53 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_44887311/article/details/136111366

版权

纽约大学与Meta合作的机器人团队开发出OK-Robot，借助视觉语言模型在陌生环境中成功执行物品抓取与放置任务，尽管成功率受环境因素影响，但零样本算法表明该技术具有潜力。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

纽约大学的机器人专家团队与Meta人工智能学院研发人员共同合作开发了一种新型机器人，该机器人具备在非结构化环境下的认知能力，可在陌生房间利用视觉语言模型（VLMs），进行物品的抓取与放置。在论文当中，该团队详细阐述了机器人的编程过程以及其在多个实际环境中的测试表现。

研究人员指出，视觉语言模型（VLMs）在过去几年中取得了很快的进步，在根据语言提示识别物体方面已经非常出色。此外团队成员也提到目前机器人夹具控制技术也在进步，机器人可以轻松的将物体拾起，即便是易碎或柔软材料，也不会将其弄坏。但基于VLMs与机器人结合的相关应用依旧处于待探索阶段。

在这里插入图片描述

该项研究当中，科学家们尝试运用Hello Robot公司所售的一款机器人来完成这一测试。该机器人具备轮子、杆子以及可伸缩手臂，手部设有夹具。研究团队为其配备了先前经过训练的视觉语言模型（VLMs），并将其命名为OK-Robot。
在这里插入图片描述

在这里插入图片描述

在实际落地测试方面，研究团队将OK-Robot分别带入10 个志愿者家中，用iPhone对室内场景进行扫描，使用LangSam和CLIP进行计算，并存储在语义内存中。之后给定一个

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。