目录
1. 图像基础
1.1 图像如何存储在计算机中
-
灰度图:矩阵
0:白色
1:黑色
0-255:灰色
-
彩色图:三个矩阵的叠加
彩色图 = 三个图层/三个通道 (每个图层由 0-255 的数字组成,用来表示红/绿/蓝 颜色的深浅)
比如,用0来表示最不红,255表示最红。
重要概念:width、height、channel
1.2 传统的图像处理
- 人工算子(矩阵形式):参数
- 卷积:运算
可以使用使用卷积神经网络,来自动学习参数。
2. 卷积的基本构件
2.1 卷积层
2.1.1 全连接神经网络 处理图像的问题
-
全连接神经网络(DNN):上下层每一个神经元全部连接
-
思路
一张灰度图像(28x28)的全部像素 flatten 成一个n 维(28x28=784)向量,然后接上不同维度(64和32)的全连接层,最后接上 softmax ,输出相应维度(10)的向量,进行最后分类。 -
采用全连接网络的问题:
- 参数太多
- 像素之间相关性太大
2.1.2 卷积层的特性/作用
- 共享参数:大大降低了网络参数——保证了网络的稀疏性,防止过拟合(之所以可以“参数共享”,是因为样本存在局部相关的特性。)
- 局部感受野:解决相关性太大的问题