可变形卷积网络--Deformable Convolutional Networks

最新推荐文章于 2025-09-04 22:24:32 发布

原创最新推荐文章于 2025-09-04 22:24:32 发布 · 2.2w 阅读

·

5

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

CNN网络结构和模型专栏收录该内容

27 篇文章

订阅专栏

本文介绍了一种新的卷积神经网络结构——可变形卷积网络，该网络通过引入可变形卷积和可变形RoI池化，提升了CNN的空间信息建模能力。与Spatial Transformer Networks相比，可变形卷积网络实现了局部且密集的转换。

https://arxiv.org/abs/1703.06211
Microsoft Research Asia
Code coming soon

本文可以看做是对 Spatial Transformer Networks 工作的深入，通过 deformable convolution 和 deformable RoI pooling提升当前CNN网络的空间信息建模能力。

Spatial Transformer Networks建立的是 global、sparse transformation ，本文的Deformable Convolutional Networks建立的是 local and dense transformation

2.1. Deformable Convolution

这里写图片描述
上图显示可变形卷积可以提高模型对 scale, aspect ratio and rotation 等映射的泛化能力。

卷积该具体怎么deformable，这个可以通过一个卷积层来学习，如下图所示：
这里写图片描述

从公式层面来说：一般的卷积可以定义如下式：
这里写图片描述

对于可变形卷积定义如下：
这里写图片描述
这个 offset ∆p n 通过卷积网络学习得到

传统卷积和可变形卷积的对比：
这里写图片描述

这里写图片描述

2.2. Deformable RoI Pooling
标准的 RoI pooling 模块将一个任意尺寸的输入矩形框特征转换到固定尺寸的特征。它主要用于基于候选区域的目标检测算法中。
pooling operation 可以如下式定义：
这里写图片描述

deformable RoI pooling 定义如下：
这里写图片描述

这个 offsets 通过一个全链接层学习
这里写图片描述

这里写图片描述

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。