背景知识:CNN随着深度增加位置信息会减少。
全连接层缺点1、位置信息 2、输入图片大小限制 3、权重太多(易过拟合);全卷积(解决降采样分辨率过低)
全连接有利于分类,不利于定位(相对位置丢失);而检测位置期望都是卷积
v1 1、孔算法 2、crf优化
fcn 后面3个层改全卷积;反卷积上采样32 。问题:压到 1./32再上采样,信息丢失太多(边界难识别)。所以,fcn结合了前面的层的信息,孔算法从另外角度解决,即一下子不压缩到那么小,例如压缩到1/8(相对1/32分辨率较高)。为何不建议压缩到1/8,因为在1/8图上,感受野太小,不利于分类,而孔算法增加了感受野。
比较普通池化、密集池化、孔算法:普通池化导致特征稀疏,即便用密集池化解决,但感受野依然小,而孔算法,计算量没有增加且没明显少掉特征,且保证每个特征上看到的感受野。
效果对比:压到过小再上采样,易出现漏空。而在采用孔算法,特征图更连续。
全连接CPF: 每2个判断距离、颜色是否接近等。
crf: 前面观察的点相互没有关系,受背后隐藏的一个或多个隐变量影响。
当损失函数难设计,常采用能量函数,能量高、概率小。(能量函数{一般分双边滤波(边缘),一部分高斯函数(位置))
V2 改进:卷到最后引入4个并行的空洞卷积(第6层用, rate不一样:6、12、18、24,从小的感受野变成大的感受野,以发现不同尺度特征(边界、主体);技巧:减少计算量连续用1*1卷积),第8层出来融合信息(相加融合)
但注意rate (膨胀率过大,会退化成1*1卷积)
V3改进 1、并联、级联 2、aspp中采用bn :(传统先卷积bn过relu,但不一定)3、最后一个图全剧平均池化 4、不用crf
级联: rate 越拉越大,顺序连接 并联:1个1*1 卷积 和3个3*3空洞卷积,采样率 6、12、18;核256个,均有 bn,,最后处理,先concat叠起来,通道多起来,1*1卷积扎透,最后全局平均池化。
V3+ 采用编码解码保护边界。