论文阅读:Reasoning about Object Affordances in a Knowledge Base Representation

该论文提出利用知识库表示对物体功能(affordance)进行推理的方法,结合图片和元数据构建Markov Logic Network(MLN)知识库。通过对视觉、物理和类别属性的建模,预测未知物体的功能,同时考虑属性之间的关系以及人类与物体的交互模式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Reasoning about Object Affordances in a Knowledge Base Representation(ECCV2014)

文章
  本论文使用了知识库表示来对物体的affordance进行推理。首先从图片或者其他meta-data的数据中获得大量的关于物体的信息,然后使用Markov Logic Network(MLN)学习一个知识库(Knowledge Base,KB)。
  首先定义什么是affordance,Gibson在他的书The Ecological Approach to Visual Perception 中定义了affordance是“properties of an object that determine what actions a human can perfrom on them”。本文用3个信息的组合来定义affordance:一个affordance的标签(如edible);一个人体姿态的表示(如骨架表示);物体相对于人的位置(如next to)。
  Knowledge base可以看做是一个用于解决问题推理的实体规则的集合,本文中KB是一个很重要的部分,本文的KB中的实体包含了物体属性以及affordance。本文用了3中属性:视觉属性(由视觉感知获得的知识),物理属性(主要是重量和尺寸),类别属性(反映了语义含义)。通过将这些属性作为物体的中间表示,可以在物体间进行知识的迁移,使得我们可以预测没有见过的物体的affordance,包括affordance label,human po

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值