对卷积层dilation膨胀的作用的理解，caffe-ssd dilation Hole算法解析

最新推荐文章于 2025-02-11 14:34:34 发布

qq_41483834

最新推荐文章于 2025-02-11 14:34:34 发布

阅读量569

点赞数

分类专栏： deep learning

deep learning 专栏收录该内容

40 篇文章

订阅专栏

本文深入解析图像分割方法Deeplab及Hole算法，介绍如何通过修改VGG16网络结构，使用dilation方法实现更dense的scoremap，提升特征图密度，以增强模型对图像细节的捕捉能力。

先转一篇大佬的博客论文阅读笔记：图像分割方法deeplab以及Hole算法解析

下面是caffe-ssd的vgg16输出后的变化，减少了一个pooling，stride=1，然后下一层采用了 dilation方法，作用按上面博客说是

既想利用已经训练好的模型进行fine-tuning，又想改变网络结构得到更加dense的score map.

即想让输出的feature map更加的稠密，于是用了hole算法,

下面一个图能说明作用

这里写图片描述

上图的颜色其实有问题，应该这么看，图a的输出0123对于图b输出的0246，然后再下一层(c)采用hole算法,c的第三个输出来自0,2,4这对应a中输出的123，所以c层有a的下一层的所有内容，同时又增加到7个输出(相比与原始a的下一层的2个输出)，所以输出变得dense了


 
   
    
   
   
    
     layer {
    
   

   
    
   
   
    
       name: 
     "pool5"   //和vgg16的差别，修改了输出
    
   

   
    
   
   
    
       type: 
     "Pooling"
    
   

   
    
   
   
    
       bottom: 
     "conv5_3"
    
   

   
    
   
   
    
       top: 
     "pool5"
    
   

   
    
   
   
    
       pooling_param {    //注意这个pooling层，步长为
     1，pad为
     1那么pool层保持原fmap不变，所以
     300*
     300的图像到这里是
     19*
     19（
     300/
     16）
    
   

   
    
   
   
    
         pool: MAX
    
   

   
    
   
   
    
         kernel_size: 
     3
    
   

   
    
   
   
    
         stride: 
     1
    
   

   
    
   
   
    
         pad: 
     1
    
   

   
    
   
   
    
       }
    
   

   
    
   
   
    
     }
    
   

   
    
   
   
    
     layer {
    
   

   
    
   
   
    
       name: 
     "fc6"   //全连接层
    
   

   
    
   
   
    
       type: 
     "Convolution"
    
   

   
    
   
   
    
       bottom: 
     "pool5"
    
   

   
    
   
   
    
       top: 
     "fc6"
    
   

   
    
   
   
    
       param {
    
   

   
    
   
   
    
         lr_mult: 
     1.0
    
   

   
    
   
   
    
         decay_mult: 
     1.0
    
   

   
    
   
   
    
       }
    
   

   
    
   
   
    
       param {
    
   

   
    
   
   
    
         lr_mult: 
     2.0
    
   

   
    
   
   
    
         decay_mult: 
     0.0
    
   

   
    
   
   
    
       }
    
   

   
    
   
   
    
       convolution_param {
    
   

   
    
   
   
    
         num_output: 
     1024
    
   

   
    
   
   
    
         pad: 
     6
    
   

   
    
   
   
    
         kernel_size: 
     3   //
     6×（
     3
     -1）+
     1=
     13，所以pad=
     6
    
   

   
    
   
   
    
         weight_filler {
    
   

   
    
   
   
    
           type: 
     "xavier"
    
   

   
    
   
   
    
         }
    
   

   
    
   
   
    
         bias_filler {
    
   

   
    
   
   
    
           type: 
     "constant"
    
   

   
    
   
   
    
           value: 
     0.0
    
   

   
    
   
   
    
         }
    
   

   
    
   
   
    
         dilation: 
     6   //膨胀系数 http://blog.youkuaiyun.com/jiongnima/article/details/
     69487519 这篇博客讲的很清楚，理解为放大，没有的地方变成
     0
    
   

   
    
   
   
    
       }
    
   

   
    
   
   
    
     }