ReKep: Spatio-Temporal Reasoning of Relational Keypoint Constraints for Robotic Manipulation

发表时间:CORL 2024 (Best paper)

论文链接:https://readpaper.com/pdf-annotate/note?pdfId=2476642985732261376&noteId=2480092969164874752

作者单位:Stanford University(Li Fei-Fei)

Motivation将机器人操作任务表示为关联机器人和环境的约束,是编码所需机器人行为的一种有前途的方法。然而,目前尚不清楚如何制定约束,使它们 1) 适用于不同的任务,2) 无需手动标记,以及 3) 由现成的求解器可实时生成机器人动作。

解决方法:具体来说,ReKep 表示为 Python 函数,将环境中的一组 3D 关键点映射到数值成本。我们证明了通过将操作任务表示为一系列关系关键点约束,我们可以使用分层优化过程来解决机器人动作(由 SE(3) 中的末端执行器姿势序列表示),并以实时频率感知-动作循环。

在机器人学中,SE(3) 常用于描述机器人的末端执行器(如机械臂的末端)的运动。末端执行器的姿势序列可以由一系列 SE(3) 变换矩阵表示,这些变换矩阵描述了末端执行器在不同时间点的位置和方向。(即SE3是末端位姿)

我们的贡献总结如下:

1)我们将操作任务制定为具有关系关键点约束的分层优化问题

2)我们设计了一个管道,使用大型视觉模型和视觉语言模型自动指定关键点和约束

3)我们在两个真实机器人平台上展示了系统实现,该平台

03-11
### ReKep概述 ReKep代表了一种新的基于关键点的机器人操作时空推理范式[^3]。该方法旨在通过识别和利用环境中的关键点来指导机器人的精确操控行为。 #### 关键技术流程 一旦获取了关键点候选,接下来会生成ReKep约束。此过程涉及三个主要阶段: 1. **视觉提示构建** 将检测到的关键点叠加在原始RGB图像之上,并结合具体任务的语言描述创建输入提示。这一步骤确保了模型能充分理解任务需求及其对应的物理位置信息[^4]。 2. **模型查询与约束生成** 使用先进的视觉-语言模型(例如GPT-4o),依据上述准备好的视觉提示自动生成定义关键点间相对几何关系(如距离、角度等)的约束条件。这些约束不仅限于静态属性,还包括随时间变化的关系动态特性。 3. **代码化表达** 所得的约束被转换成可编程的形式——通常是Python函数,以便无缝集成至现有的机器人控制系统中,从而实现高效的运动规划与控制逻辑实施。 ```python def generate_rekep_constraints(keypoints, task_description): """ Generates spatial-temporal reasoning constraints based on keypoints and a given task description. Args: keypoints (list): List of detected keypoint candidates from the scene. task_description (str): Natural language instruction describing the desired manipulation task. Returns: function: A Python function that defines the spatio-temporal relationships between keypoints as per the task requirements. """ # Visual prompt creation by overlaying keypoints onto an RGB image along with the task description visual_prompt = create_visual_prompt(image=rgb_image, keypoints=keypoints, text=task_description) # Query VLM to get ReKep constraints expressed in terms of geometric relations among keypoints over time rekep_constraints_code = query_vlm(visual_prompt) return eval(rekep_constraints_code) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

KKdlg

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值