摘要
本周以图像识别为例,从两个角度学习了卷积神经网络(CNN),以及CNN的全过程总结和应用,学习了CNN的三种简化参数的方法。
Abstract
This week, taking image recognition as an example, we learned convolutional neural network (CNN) from two perspectives, as well as the whole process summary and application of CNN, and learned three methods of simplifying parameters of CNN.
卷积神经网络(CNN)
卷积神经网络是一种非常典型的网络架构,常用于图像分类等任务。
所谓的图像分类,就是给机器一张图片,由机器去判断这样图片里面有什么东西,比如判断这张图片里面是猫,狗,汽车等
假设输入的每张图片的尺寸都相同比如为:100像素×100像素。
对于机器,可以把图片看成是一个三维的张量(tensor),分别代表图像的宽,高以及图像的通道(channel)的数目。
通道(channel):彩色图像的每个像素都可以描述为红色(red)、绿色(green)、蓝色(blue)的组合,这 3 种颜色就称为图像的 3 个色彩通道。
把这个三维张量“拉直”,组成一排作为一个巨大的向量,作为网络的输入
假如把向量作为全连接网络的输入,输入的特征向量长度为100×100×3,由于每个神经元跟输入的向量中的每个数值都需要一个权重,且第 1 层有 1000 个神经元时,第 1 层的权重就需要 1000×100×100×3 = 3 × 1 0 7 10^7 10