ZFNet
论文《Visualizing and Understanding Convolutional Neural Networks》
1 论文思想
文章主要用于实现卷积神经网络(CNN,Convelutional Neural Network)的可视化工作,主要是针对于CNN每层得到的特征映射(feature mapping)的可视化。
博客中提到的feature mapping指的是一般化的特征映射,即经过卷积激活池化后得到的特征映射,这一点与论文中的表述有所冲突,请注意分辨。
文中指出,CNN的可视化工作有利于去理解CNN网络的工作原理,并在此基础上去改进CNN网络已获得更好的性能表现。
2 feature mapping可视化
文中使用反卷积神经网络(deconvnet)来实现对feature mapping的可视化。
deconvnet实际上就是convnet的逆操作。通过在已训练好的AlexNet的基础上,在网络的每一层都加入deconvnet。feature mapping通过deconvnet的多次迭代,实现feature mapping到输入空间(input space)的映射(projection)。
deconvnet主要包括三部分:
-
unpooling
unpooling是pooling的逆操作。
convnet中的pooling是一个损失信息以实现降维的过程。以maxpooling为例,卷积层通过激活函数ReLU得到rectified feature mappings,经过maxpooling取局部区域(一般为2*2的区域,步长s=2)的最大值代表整个局部区域,此时得到的pooled mappings空间大小是rec

本文深入探讨了ZFNet,一种基于AlexNet的改进模型,重点关注如何通过反卷积神经网络(deconvnet)实现特征映射可视化。研究发现,CNN的高层特征更具代表性,且模型的低层比高层更快收敛。通过对AlexNet的第一层卷积层进行调整,解决了特征忽视和伪影问题,提升了分类性能。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



