Franka助力GraspMolmo研究,实现可泛化任务导向抓取的关键突破

研究背景:

 

传统机器人抓取技术多依赖物体几何特征,仅关注抓取稳定性,却忽视任务具体需求例如同一把刀在“切菜”与“安全传递”任务中需要完全不同的抓取位置。

现有面向任务的抓取(TOG)方法受限于小规模数据集、简化语言描述及整洁场景假设,难以泛化至新任务和未见过物体,导致真实复杂环境中灵活性不足。

为解决这一难题,研究团队以Franka Research 3七自由度机械臂为实验平台,提出了GraspMolmo——一种可泛化的开放词汇任务导向抓取模型

其核心目标是:通过结合自然语言指令与单帧RGB-D图像,精准预测符合任务需求的抓取方式,真正实现“机器人不仅能抓,还懂为何抓、如何抓”。

GraspMolmo是一种可泛化的开放词汇面向任务的抓取模型,它在给定自然语言指令的情况下预测语义上合适的抓取

核心方法:GraspMolmo与PRISM数据集

    GraspMolmo的突破离不开两大关键支撑:大规模合成数据集PRISM的构建,以及基于视觉语言模型的高效训练。

    1.PRISM:大规模任务语义抓取数据集

    评论
    添加红包

    请填写红包祝福语或标题

    红包个数最小为10个

    红包金额最低5元

    当前余额3.43前往充值 >
    需支付:10.00
    成就一亿技术人!
    领取后你会自动成为博主和红包主的粉丝 规则
    hope_wisdom
    发出的红包
    实付
    使用余额支付
    点击重新获取
    扫码支付
    钱包余额 0

    抵扣说明:

    1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
    2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

    余额充值