deplab V1、V2、V3

wykqhyjs

于 2020-04-06 14:04:58 发布

阅读量324

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/wykqhyjs/article/details/105342192

版权

本文探讨了深度学习在图像识别中的应用，特别是全卷积网络（FCN）、空洞卷积及条件随机场（CRF）在提升图像识别精度方面的作用。通过分析不同卷积策略如普通池化、密集池化和空洞算法对特征提取的影响，以及它们如何改善边界识别和分类准确度，文章深入讨论了如何优化网络结构以提高图像识别的效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

背景知识：CNN随着深度增加位置信息会减少。

全连接层缺点1、位置信息 2、输入图片大小限制 3、权重太多（易过拟合）；全卷积（解决降采样分辨率过低）

全连接有利于分类，不利于定位（相对位置丢失）；而检测位置期望都是卷积

v1 1、孔算法 2、crf优化

fcn 后面3个层改全卷积；反卷积上采样32 。问题：压到 1./32再上采样，信息丢失太多（边界难识别）。所以，fcn结合了前面的层的信息，孔算法从另外角度解决，即一下子不压缩到那么小，例如压缩到1/8（相对1/32分辨率较高）。为何不建议压缩到1/8，因为在1/8图上，感受野太小，不利于分类，而孔算法增加了感受野。

比较普通池化、密集池化、孔算法：普通池化导致特征稀疏，即便用密集池化解决，但感受野依然小，而孔算法，计算量没有增加且没明显少掉特征，且保证每个特征上看到的感受野。

效果对比：压到过小再上采样，易出现漏空。而在采用孔算法，特征图更连续。

全连接CPF: 每2个判断距离、颜色是否接近等。

crf: 前面观察的点相互没有关系，受背后隐藏的一个或多个隐变量影响。

当损失函数难设计，常采用能量函数，能量高、概率小。（能量函数{一般分双边滤波（边缘），一部分高斯函数（位置））

V2 改进：卷到最后引入4个并行的空洞卷积（第6层用， rate不一样：6、12、18、24，从小的感受野变成大的感受野，以发现不同尺度特征（边界、主体）；技巧:减少计算量连续用1*1卷积），第8层出来融合信息（相加融合）

但注意rate （膨胀率过大，会退化成1*1卷积）

V3改进 1、并联、级联 2、aspp中采用bn :（传统先卷积bn过relu，但不一定）3、最后一个图全剧平均池化 4、不用crf

级联： rate 越拉越大，顺序连接并联：1个1*1 卷积和3个3*3空洞卷积，采样率 6、12、18；核256个，均有 bn,，最后处理，先concat叠起来，通道多起来，1*1卷积扎透，最后全局平均池化。

V3+ 采用编码解码保护边界。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。