Grasp Pose Detection with Affordance-based Task Constraint Learning in Single-view Point Clouds

最新推荐文章于 2025-01-21 09:52:49 发布

原创最新推荐文章于 2025-01-21 09:52:49 发布 · 961 阅读

6 ·

CC 4.0 BY-SA版权

论文阅读专栏收录该内容

5 篇文章

订阅专栏

该研究针对机器人抓取任务，提出了一种新的方法，它结合了Affordance检测和抓取位姿规划。与传统全局Affordance检测不同，该方法通过局部Affordance检测提高泛化能力，并使用Mask-RCNN进行精准检测。在未知物体上，通过检测任务相关的affordance，生成适合任务约束的抓取策略。方法首先利用ResNet进行多任务学习，检测物体和affordance，然后通过KNN匹配将检测结果应用于点云，优化抓取位姿。这种方法提高了实时性和准确性，减少了对3D模型的依赖，尤其适用于单视角点云场景。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.解决的问题

Knowing how to grasp is generally more challenging than what to grasp for a robot.
从单视角点云规划抓取的挑战性在于模型需要对RGB-D感知的不精确和不完整进行补偿。

GPD方法在物体CAD模型未知的情况下直接从RGB-D传感信息中检测3DoF或6DoF抓取位姿，取得了很好的效果，而且在未知物体抓取上有很好的泛化性。与GPD抓取任意（any）物体不同的是，本文聚焦于物体操作任务中任务导向（task-specific, goal-oriented）的抓取。为了推理任务需求和满足特定任务约束，一个抓取规划器需要从物体功用属性中提取出抓取策略。

任务约束通常被归结为affordance检测的问题。传统的全局affordance检测需要先进行物体识别，然后再进行6DoF位姿估计，这些方法的局限性在于不能泛化到新物体。affordance也可以指物体的几何形状和表面，但是需要物体3D模型。相反，局部affordance检测通过手工设计的特征或CNN利用物体的patches或parts，CNN方法能端到端进行affordance检测并且能泛化到新物体。

定位和识别相关物体也很关键，同时进行物体检测和affordance检测，避免了affordance检测对正确检测物体的依赖性。采用多任务损失函数联合训练，可避免级联CNN计算效率低下。

论文受文献Affordancenet: an End-To-End Deep Learning Approach for Object Affordance Detection（ICRA2018）启发，不同之处是论文方法采用的是物体分割。

与end-to -end affordance检测的SOTA方法Knowledge Induced Deep Q-Network for Robot Push and Grasp Manipulation Skills Learning（2019 Autonomous Robots）相比，论文不同之处在于将affordance和抓取位姿结合，能保证力闭合和任务约束。

与 PointNetGPD 直接从点云中检测相比，论文方法先检测affordance，再将检测的部分与点云配准，避免了直接对点云3D分割，保证了更高的实时性；网络不依赖于标注的3D分割数据。

与 GPD 方法主要的不同在于)：1）论文聚焦于任务约束的抓取，检测物体affordance作为约束，GPD确定最佳抓取；2）GPD使用完整点云训练，论文使用单视角点云。