Reasoning about Object Affordances in a Knowledge Base Representation(ECCV2014)
文章
本论文使用了知识库表示来对物体的affordance进行推理。首先从图片或者其他meta-data的数据中获得大量的关于物体的信息,然后使用Markov Logic Network(MLN)学习一个知识库(Knowledge Base,KB)。
首先定义什么是affordance,Gibson在他的书The Ecological Approach to Visual Perception 中定义了affordance是“properties of an object that determine what actions a human can perfrom on them”。本文用3个信息的组合来定义affordance:一个affordance的标签(如edible);一个人体姿态的表示(如骨架表示);物体相对于人的位置(如next to)。
Knowledge base可以看做是一个用于解决问题推理的实体和规则的集合,本文中KB是一个很重要的部分,本文的KB中的实体包含了物体属性以及affordance。本文用了3中属性:视觉属性(由视觉感知获得的知识),物理属性(主要是重量和尺寸),类别属性(反映了语义含义)。通过将这些属性作为物体的中间表示,可以在物体间进行知识的迁移,使得我们可以预测没有见过的物体的affordance,包括affordance label,human po
使用知识库推理物体功能:ECCV2014论文解析

该论文提出利用知识库表示对物体功能(affordance)进行推理的方法,结合图片和元数据构建Markov Logic Network(MLN)知识库。通过对视觉、物理和类别属性的建模,预测未知物体的功能,同时考虑属性之间的关系以及人类与物体的交互模式。
最低0.47元/天 解锁文章
757

被折叠的 条评论
为什么被折叠?



