DenseNet_清华大学黄高 densnet-优快云博客

DenseNet是一种创新的深度学习网络结构，它通过密集连接的模块解决了深层网络的梯度消失问题，增强了特征传播并减少了参数数量。DenseNet-B和DenseNet-BC通过加入瓶颈层和压缩率进一步优化了模型，实验证明其在ImageNet数据集上优于ResNet。

转载自：https://blog.youkuaiyun.com/qq_14845119/article/details/79272082

DenseNet优势：
（1）解决了深层网络的梯度消失问题
（2）加强了特征的传播
（3）鼓励特征重用
（4）减少了模型参数

DenseNet的网络基本结构如上图所示，主要包含DenseBlock和transition layer两个组成模块。其中Dense Block为稠密连接的highway的模块，transition layer为相邻2个Dense Block中的那部分。

上图是一个详细的Dense Block模块，其中层数为5，即具有5个BN+Relu+Conv(3*3)这样的layer，网络增长率为4，简单的说就是每一个layer输出的feature map的维度为4。
这里，由于DenseNet的每一个Dense Block模块都利用到了该模块中前面所有层的信息，即每一个layer都和前面的layer有highway的稠密连接。假设一个具有L层的网络，那么highway稠密连接数目为L*(L+1)/2。
和Resnet不同的是，这里的连接方式得到的feature map做的是concat操作，而resnet中做的是elementwise操作。
其中ResNet的非线性变换方程如下：

DensNet的非线性变换方程如下：

highway的稠密连接方式具有诸多的优势，增加了梯度的传递，特征得到了重用，甚至减少了在小样本数据上的过拟合。但是随之产生2个缺点。

(1) 这里假设第L层输出K个feature map，即网络增长率为K，那么第L层的输入为K0+K*(L-1)，其中K0为输入层的维度。也就是说，对于Dense Block模块中每一层layer的输入feature map时随着层数递增的，每次递增为K，即网络增长率。那么这样随着Dense Block模块深度的加深，后面的输入feature map的维度是很大的。为了解决这个问题，在Dense Block模块中加入了Bottleneck 单元，即1*1卷积进行降维，输出维度都被降到4K维(K为增长率)。

(2) 每一个DenseBlock模块的输出维度是很大的，假设一个L层的Dense Block模块，假设其中已经加入了Bottleneck 单元，那么输出的维度为，第1层的维度+第2层的维度+第3层的维度+******第L层的维度，加了Bottleneck单元后每层的输出维度为4K，那么最终Dense Block模块的输出维度为4K*L。随着层数L的增加，最终输出的feature map的维度也是一个很大的数。为了解决这个问题，在transition layer模块中加入了1*1卷积做降维。

文章同时提出了DenseNet，DenseNet-B，DenseNet-BC，三种结构，具体区别如下：

原始DenseNet:

Dense Block模块:BN+Relu+Conv(3*3)+dropout

transition layer模块:BN+Relu+Conv(1*1)(filternum:m)+dropout+Pooling(2*2)

DenseNet-B:

Dense Block模块:BN+Relu+Conv(1*1)(filternum:4K)+dropout+BN+Relu+Conv(3*3)+dropout

transition layer模块:BN+Relu+Conv(1*1)(filternum:m)+dropout+Pooling(2*2)

DenseNet-BC:

Dense Block模块:BN+Relu+Conv(1*1)(filternum:4K)+dropout+BN+Relu+Conv(3*3)+dropout

transition layer模块:BN+Relu+Conv(1*1)(filternum:θm，其中0<θ<1，文章取θ=0.5)+dropout+Pooling(2*2)

其中，DenseNet-B在原始DenseNet的基础上，在Dense Block模块中加入了1*1卷积，使得将每一个layer输入的feature map都降为到4k的维度，大大的减少了计算量。

DenseNet-BC在DenseNet-B的基础上，在transitionlayer模块中加入了压缩率θ参数，论文中将θ设置为0.5，这样通过1*1卷积，将上一个Dense Block模块的输出feature map维度减少一半。

DenseNet-BC的网络结构参数如下，其中网络增长率K=32，conv 代表BN-ReLU-Conv

在ImageNet上DenseNet-BC和ResNet对比如下

可以看出，DenseNet-BC比ResNet参数量要少，运算量也少，准确性高。

References:

https://github.com/liuzhuang13/DenseNet

https://github.com/liuzhuang13/DenseNetCaffe
---------------------
作者：watersink
来源：优快云
原文：https://blog.youkuaiyun.com/qq_14845119/article/details/79272082
版权声明：本文为博主原创文章，转载请附上博文链接！