【论文笔记】Network In Network

最新推荐文章于 2021-02-01 15:16:23 发布

原创最新推荐文章于 2021-02-01 15:16:23 发布 · 450 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#Network In Network #深度学习

深度学习同时被 2 个专栏收录

60 篇文章

订阅专栏

论文

15 篇文章

订阅专栏

本文介绍了Network In Network (NiN)结构，一种利用多层感知机替代传统卷积层的深度学习模型。该模型通过引入mlpconv层增强特征抽象，并采用全局平均池化层替代全连接层以减少过拟合，提升模型解释性和泛化能力。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

介绍

CNN中用到的卷积滤波器对于潜在的数据块来说是一个通用的线性模型(GLM)，我们认为GLM抽象的层次比较低。用一个更强大的非线性函数逼近器作为“微型网络”取代GLM能提高模型的抽象能力。在NiN中我们的微型网络选用的是一个多层感知机。从网络结构的角度来看我们相当于增加了一个称之为mlpconv的网络层，它和线性的卷积层类似，都是将局部感受野映射为一个特征向量。Mlpconv使用一个包含了多个全连接层和非线性激活函数的多层感知机(MLP)将输入数据块映射为输出特征向量。通过像CNN那样在输入数据上滑动MLP从而得到特征图(feature maps)，并将其导入到下一层网络。NiN的整体结构可以看作是多个mlpconv层的叠加。

我们使用一个全局池化层(global average pooling layer)取代最终的全连接层，对最后一层mlpconv的输出特征图通过一个全局池化层进行空间平均作为分类置信度，结果向量直接导入到softmax分类器。全局池化层相比全连接层更具有可解释性，因为它将特征图和分类做了对应。除此之外，全连接层更容易过拟合并且严重依赖于dropout正则化，而全局池化层它自身就相当于一个正则化器，原生的具备防止过拟合的功能。

CNN

经典的卷积神经网络由交替堆叠的卷积层和空间池化层构成。卷积层通过卷积滤波器再紧跟着一个非线性激活函数(rectifier、sigmoid、tanh等等)生成特征图。拿线性修正器来说，特征图可以由以下公式计算得到：

其中，(i,j)表示特征图中像素点的坐标，Xi,j表示以(i,j)为中心点的输入数据块，k表示特征图的通道索引。

Network In Network

首先，强调一下我们提出的“Network In Network”结构中的核心组件：MLP卷积层和全局池化层。

MLP Convolution Layers

考虑到潜在概念(latent concepts)没有先验信息，使用通用的函数逼近器来做局部数据的特征提取是可取的，它能够更加接近于潜在概念的抽象表达。羟向基和多层感知机是两种比较著名的通用函数逼迫器。我们之所以选择多层感知机有两方面的原因。首先，多层感知机与卷积神经网络兼容，也是基于反向传播算法进行训练。其次，多层感知机自身就可以是一个深度模型，这与特征重用的思想一致。在这篇论文中，我们提出的用于取代卷积层的新的网络层称之为mlpconv，其计算公式如下。