论文阅读:Zoom-Net: Mining Deep Feature Interactions for Visual Relationship Recognition

本文深入探讨Zoom-Net模型在视觉关系识别中的应用,通过Appearance、Context-Appearance和Spatiality-Context-Appearance模块研究对象与关系特征的交互。论文提出Constractive RoI Pooling和Pyramid RoI Pooling技术,结合Intra-Hierarchical Tree结构,以增强特征融合和分类性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Zoom-Net(ECCV2018)

文章
  Paper展示了通过对local的object feature和global的predicate feature进行深层次的message passing和interaction是增强relationship recognization性能的一个有效途径。为了能够对object和predicate学习好的特征,paper研究了3种可解释的模型。
在这里插入图片描述
1)Appearance Module(b):
  关注每个RoI的自身依赖性,不使用message passing,独立地对object和predicate特征进行学习,而且无法获得空间和上下文的信息。
2)Context-Appearance Module(c):
  直接在subject,predicate,object三个分支中进行信息的传递,但是这些特征信息的组合并不考虑这些RoI在原图中的空间分布。
3)Spatiality-Context-Appearance Module(d):
  空间特征是指比如subject和object之间的相对尺寸和位置
接下来是paper提出的模型的细节:
在这里插入图片描述
1)Constractive RoI Pooling:
  代表了一个<RoI, deRoI>的操作,首先对object进行RoI pooling得到归一化的局部特征,然后将这些特征进行deRoI pooling到predicate的box内,然后在该特征周围

NetZoom图形模板库是世界上最大 Visio图形模板库 ,包含:制造商特定网络和数据中心设备形状模具和数据库模具。它包含超过254,000形状和超过4500个的主要供应商和制造商的模具。 模板库库涵盖从IT硬件的形状和模具制造商,网络,数据中心,计算机,通讯,音像,和安全等行业,此外,还可用于创建逻辑图的图标和符号。 NetZoom图形模板库特点: 1. 智能形状 -嵌入式数据和属性,如制造商和产品信息,物理尺寸,电力和能源的需求,热量水平,端口属性,属性和特点进行了广泛的涵盖。 2. 高质量的形状格外详细,准确和真实生活的网络图形表示,安全和音频/视频硬件。 3. 可伸缩矢量图形 ,使用可扩展的彩色矢量图形,缩放到任何尺寸的。 4. 多角度视图与多个二维和三维的角度的观看。 5.可输入插槽和端口包含设备插槽,数据端口和电源端口,符合制造商的规格。 6. 安装和连接点,对应设备的端口和插槽,允许安装和端口级的连接。 我们的图形模板库是每天更新。 http://www.visiostencils.com/solutions/ U:完成后,所有功能于一身的库。它包含超过254,000的制造商超过4500领先供应商,并从IT硬件制造商的特定的网络和数据中心设备的形状和模具,网络,数据中心,计算机,电信,音频视频和安全等行业和不断发展壮大。除了物理网络图的形状和模具,NetZoom还提供了通用,可用于创建逻辑网络图的图标和符号的形状和模具。 CT:这个库是面向网络和数据中心的IT专业人士。这个库包含超过222000超过3100的领先供应商的网络,数据中心和电信硬件设备形状和模具。 AV:这个库是面向音频视频专业人士。这个库包含56000余超过1600音频视频硬件的领先供应商的设备形状和模具。 (以上为Google翻译得来。。。。) 这3个图库是免费的图库,需要更多图库的,请购买收费版的模板。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值