deplab V1、V2、V3

本文探讨了深度学习在图像识别中的应用,特别是全卷积网络(FCN)、空洞卷积及条件随机场(CRF)在提升图像识别精度方面的作用。通过分析不同卷积策略如普通池化、密集池化和空洞算法对特征提取的影响,以及它们如何改善边界识别和分类准确度,文章深入讨论了如何优化网络结构以提高图像识别的效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

背景知识:CNN随着深度增加位置信息会减少。

全连接层缺点1、位置信息 2、输入图片大小限制 3、权重太多(易过拟合);全卷积(解决降采样分辨率过低)

全连接有利于分类,不利于定位(相对位置丢失);而检测位置期望都是卷积

v1  1、孔算法 2、crf优化

 fcn 后面3个层改全卷积;反卷积上采样32 。问题:压到 1./32再上采样,信息丢失太多(边界难识别)。所以,fcn结合了前面的层的信息,孔算法从另外角度解决,即一下子不压缩到那么小,例如压缩到1/8(相对1/32分辨率较高)。为何不建议压缩到1/8,因为在1/8图上,感受野太小,不利于分类,而孔算法增加了感受野。

比较普通池化、密集池化、孔算法:普通池化导致特征稀疏,即便用密集池化解决,但感受野依然小,而孔算法,计算量没有增加且没明显少掉特征,且保证每个特征上看到的感受野。

效果对比:压到过小再上采样,易出现漏空。而在采用孔算法,特征图更连续。

全连接CPF: 每2个判断距离、颜色是否接近等。

  crf: 前面观察的点相互没有关系,受背后隐藏的一个或多个隐变量影响。

当损失函数难设计,常采用能量函数,能量高、概率小。(能量函数{一般分双边滤波(边缘),一部分高斯函数(位置))

V2 改进:卷到最后引入4个并行的空洞卷积(第6层用, rate不一样:6、12、18、24,从小的感受野变成大的感受野,以发现不同尺度特征(边界、主体);技巧:减少计算量连续用1*1卷积),第8层出来融合信息(相加融合)

但注意rate (膨胀率过大,会退化成1*1卷积)

V3改进  1、并联、级联 2、aspp中采用bn :(传统先卷积bn过relu,但不一定)3、最后一个图全剧平均池化  4、不用crf

级联: rate 越拉越大,顺序连接  并联:1个1*1 卷积 和3个3*3空洞卷积,采样率 6、12、18;核256个,均有 bn,,最后处理,先concat叠起来,通道多起来,1*1卷积扎透,最后全局平均池化。

V3+ 采用编码解码保护边界。

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值