CNN-day12-可变形卷积

最新推荐文章于 2025-05-14 22:27:44 发布

谢眠

最新推荐文章于 2025-05-14 22:27:44 发布

阅读量877

点赞数 21

分类专栏：深度学习文章标签： cnn 深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/keep_keeprogress/article/details/145518438

版权

深度学习专栏收录该内容

19 篇文章

订阅专栏

day13-可变形卷积

Deformable Convolution可变形卷积，由微软亚洲研究院提出

DCNv1：[1703.06211] Deformable Convolutional Networks

DCNv2：[1811.11168] Deformable ConvNets v2: More Deformable, Better Results

1 标准卷积

传统卷积是对输入特征图的每一个位置施加相同的权重，并在固定的感受野上进行计算。这种固定的几何结构对空间上存在复杂变形（如旋转、缩放、非刚性变形等）的目标存在局限性。

2 Deformable Convolution可变形卷积

可变形卷积的核心思想是引入自适应的空间位移（offsets），灵活应对几何变形，从而更好的捕捉和建模物体细节。

它通过两个步骤来实现：

学习偏移量：通过额外的卷积层来学习卷积核在每个位置的偏移量（offsets）。
采样和卷积：根据学习到的偏移量对输入特征图进行采样，进而完成卷积操作。

2.1图解可变形卷积

图解：

Conv： 用于生成特征图和偏移量的卷积层。
Offset Field： 通过卷积生成的偏移量，用于指导后续的可变形卷积如何“变形”。
2N：对于 N 大小的卷积核（如 3×3 的核 N=9），需要生成 N 个偏移向量。

偏移向量包含 x 和 y 两个方向，因此偏移量的维度是 2× N。

Deformable Convolution： 最终结合偏移量后，在输入特征图上进行自适应采样的卷积操作。
偏移量共享，权重独立；

2.2数解可变形卷积

2.2.1采样点集合

卷积核的采样点集合 R 公式如下表示：k 是卷积核大小

$$
\mathcal{R}=\{(i,j)|i,j\in[-\frac{k-1}{2},\frac{k-1}{2}]\}
$$

如果考虑膨胀卷积：d 是膨胀率， d = 1 就是不膨胀

$$
\mathcal{R}=\{(i\cdot d,j\cdot d)|i,j\in[-\frac{k-1}{2},\frac{k-1}{2}]\}
$$

于是就有了上面的R： 3×3，且 d = 1：

$$
\mathcal{R}=\{(-1,-1),(-1,0),(-1,1),(0,-1),(0,0),(0,1),(1,-1),(1,0),(1,1)\}
$$

2.2.2标准卷积

$$
y(\mathbf{p}_0)=\sum_{\mathbf{p}_n\in\mathcal{R}}w(\mathbf{p}_n)\cdot x(\mathbf{p}_0+\mathbf{p}_n)
$$

$$
p_0：中心位置坐标
$$

$$
\mathcal{R}：卷积核的采样点集合。
$$

$$
\mathbf{p}_n：相对于中心点 \mathbf{p}_0 的第 n 个采样点的位置。
$$

$$
w(\mathbf{p}_n)：卷积核在第 n 个位置的权重。
$$

$$
x(\mathbf{p}_0 + \mathbf{p}_n)：输入特征图 x 在位置 \mathbf{p}_0 + \mathbf{p}_n 处的像素值。
$$

2.2.3可变形卷积

$$
\mathbf{y}(\mathbf{p}_0)=\sum_{\mathbf{p}_n\in\mathcal{R}}\mathbf{w}(\mathbf{p}_n)\cdot\mathbf{x}(\mathbf{p}_0+\mathbf{p}_n+\Delta\mathbf{p}_n)
$$

$$
p_0表示中心位置坐标
$$

$$
\Delta \mathbf{p}_n：卷积核第 n 个位置的偏移量，它通过额外的卷积层动态学习得到。
$$

非整数位置：学习到的偏移位置并非整数，那如何定位采样位置？通过双线性插值计算得到。

3 实验效果

可变形卷积通过将采样位置与感兴趣的实例对齐来帮助更好地进行特征采样，并更好地处理比例、旋转和纵横比的变化。

博客等级

码龄3年

77
原创

1154
点赞

1093
收藏

579
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: CNN-day11-注意力机制

下一篇：: YOLO-day1-YOLO1-4

最新评论

机器学习day5-随机森林和线性代数1最小二乘法
征途黯然.: 评论：随机森林作为集成学习方法，在处理高维度和大规模数据集方面表现出色，其通过随机选择特征和样本，有效降低过拟合风险。
从0开始学Python-day1-工具和使用
优快云-Ada助手: 推荐 Python入门技能树：https://edu.youkuaiyun.com/skill/python?utm_source=AI_act_python
从0开始学Python-day1-工具和使用
优快云-Ada助手: 恭喜你这篇博客进入【优快云每天最佳新人】榜单，全部的排名请看 https://bbs.youkuaiyun.com/topics/619332897。

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。