对于小规模的数字图像处理问题已有的大量机器学习算法可以较好地实现,但如果直接应用于大规模海量图像的处理,则会由于复杂度过高而难以在实际系统中实现,因此需要出现更为高效的图像分类算法来解决:采用一些新的特征降低训练时间;多种技术降低overfitting;基于深度卷积神经网络。通过深度卷积神经网络实现图像分类取得了很好的效果,
参考文献
ImageNet Classification with Deep Convolutional
Neural Networks来进行介绍。
卷积神经网络(CNN)是一种多层神经网络,每层由多个二维平面组成,每个平面由多个相互独立的神经元组成。通常为特征提取层和降采样层交替组成,最后为全连接层得到输出。特征提取层的神经元对前一层的局部感受野进行卷积运算提取特征,而降采样层对上一层得到的特征的相邻像素之间进行取平均或求最大值的操作,得到新的特征映射图。然后多次重复上述步骤,并把最后得到的像素值光栅化,连接成一个输入向量输入到一个传统的神经网络中并得到输出。
经典的卷积神经网络包括卷积神经层、Rectified Linear Units 层(ReLU)、亚采样层(Pooling 层)和规范化层。卷积神经层是对图像的一个邻域进行卷积得到图像的邻域特征,就是对图像的每个点进行卷积运算,卷积核都被作为训练参数。卷积神经层可以看作是对输入图像进行“抽象”的操作,经过几次处理之后,能够提取出图像的“特征值”。修正线性单元( ReLUs,rectified linear units) 作为非线性激活函数用于卷积神经层后面的数据训练。亚采样层就是使用pooling技术将小邻域内的特征点整合得到新的特征。Pooling 层即对图像进行