FCN: 卷积和转置卷积等

最新推荐文章于 2025-10-07 13:55:02 发布

原创最新推荐文章于 2025-10-07 13:55:02 发布 · 1.5k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#计算机视觉 #FCN #图像分割 #深度学习 #卷积

深度学习与机器学习专栏收录该内容

23 篇文章

订阅专栏

本文详细探讨了卷积神经网络中的各种卷积操作及其复合效果，并介绍了卷积层、池化层和激活函数的特性。此外，还分析了特征图大小、转置卷积以及在图像语义分割中的应用。

各种卷积的动态图

这里写图片描述

这里y是下一层(i,j)处的值，k是kernel size, s是stride，f泛指卷积层，池化层和激活函数。这些操作都具有局部性，限定在x的delta邻域中。

这里写图片描述

这里是说两个这样的操作可以进行复合，复合后的“等效”kernel size和stride在右下角。
这里写图片描述

如上图，若第一层的k=3，第二层的k=1，则等效k=3；若第一层的k=3，第二层的k=2，则等效k=4。

相关基础知识：
卷积层feature map大小
这里写图片描述

If you stack two 3x3 CONV layers on top of each other then you can convince yourself that the neurons on the 2nd layer are a function of a 5x5 patch of the input (we would say that the effective receptive field of these neurons is 5x5). If we use dilated convolutions then this effective receptive field would grow much quicker. cs231n

Transposed convolution arithmetic
所谓的转置是针对将卷积层表达为矩阵运行得到的，在反向传播中转置矩阵使得后面低维度的Loss变为高维度。见下图
这里写图片描述

FCN paper中将不同的池化层进行了融合：
这里写图片描述

获得了提升：
这里写图片描述

反卷积和上池化，直接引用【总结】图像语义分割之FCN和CRF
：
这里写图片描述

最后，一个图像分割的专栏：https://zhuanlan.zhihu.com/semantic-segmentation

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。