DenseNet

原创于 2017-09-22 19:44:22 发布 · 4.3k 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

深度学习基础专栏收录该内容

18 篇文章

订阅专栏

DenseNet是一种创新的卷积神经网络结构，通过密集连接层改进了特征传递与梯度传播，实现了更高效的特征复用。相较于ResNet，DenseNet采用特征拼接而非相加的方式整合特征，并使用Concat层来保持特征宽度，减少参数量。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

2017CVPR Best Paper：《Densely Connected Convolutional Networks》

Github项目主页： https://github.com/liuzhuang13/DenseNet

知乎上的一些讨论：如何评价Densely Connected Convolutional Networks？

DenseNet的高效版本，解决训练占用显存大的问题：《Memory-Efficient Implementation of DenseNets》

DenseNet属于对ResNet扩展的一系列工作中比较有代表性的一个。

1. 方法介绍

这里写图片描述

DenseNet整个网络采用了模块化设计，其中一个典型网络模块结构如下：

如上图，该模块共包含4层(BN+ReLU+Conv)。每一层都有一个“短路”或者“跳接”与其后的每一层相连。因此，4层实际上总共产生4+3+2+1=10个连接。

上述结构带来的优点主要有：

加强了信息前传，避免了梯度的反传消失
加强了对特征的多级综合高效利用
一定程度上可以使用更少的参数数量来达到相同的效果

2. DenseNet vs. ResNet

如果在Netscope这一网络结构可视化平台将DenseNet和ResNet分别进行可视化，你会发现二者的网络结构 “看起来几乎一样”。

这时候你有可能会有疑问：

为啥DenseNet和ResNet这么像？
DenseNet那么多“跳接”去哪了？

解决上面的疑问，请看下面DenseNet和ResNet的对比：

（1）DenseNet采用Concat层来整合不同来源的特征，而ResNet则采用Eltwise层的加法操作。

DenseNet大部分的优势都是Concat层带来的：

Concat层只是特征拼接，不对特征做任何改变。因此，只需相邻层的一个“短接”，后续所有层都可以拥有到该层的“通路”。这些通路意味着更佳的信息前传与梯度反传。
Concat层会使得feature map “变厚”，因此即使我们使用更少的卷积参数，feature map也不会因过小而产生信息瓶颈。这也是DenseNet一定程度上参数更少的原因。

（2）DenseNet采用transition层(BN+1x1卷积+2x2AvePooling)来实现下采样，而ResNet则多采用MaxPooling以及卷积的stride。

（3）DenseNet由于在一个模块中要使用Concat，因此feature map的大小必须保持不变。而ResNet则会存在下面的这种下采样的特殊情况：

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。