卷积神经网络(Convolutional Neural Networks, CNN)是包含卷积计算且具有深度结构的前馈神经网络,主要由三部分组成:卷积层、池化层和全连接层,其基本型的完整架构展示具体结构如图1所示。
1) 卷积层
在CNN中卷积层位于关键位置,其主要功能是对输入数据进行特征提取。借助卷积运算,卷积层能够有效捕获数据中的重要特征,并加强原始信号中的关键特征,同时有效减少特征的维度。卷积核根据预先设定的参数在特征图上执行扫描运算,从而生成输出特征,其中二维卷积神经网络的卷积过程如图2所示。
卷积层存在两个主要缺陷:1) 数据边界的限制导致边缘信息丢失,边缘数据仅对少数输出数据有影响,而中间数据影响更多,使得边缘信息难以充分利用; 2) 随着卷积层数增多,输出数据尺寸逐渐缩小,限制了深度卷积神经网络的应用。填充技术解决这两个问题,通过在输入数据边界外填充某些特定的值(一般是 0),增大输入数据尺寸,保持输出数据尺寸不缩减,提高边界数据对输出的影响,采用填充技术后卷积运算过程如图3所示。