零 序言
火了很久的人工智能里有个分支是机器学习,机器学习里有个分支是深度学习。
深度学习又有两大分支:
- 一个是挖掘文本语义信息的循环神经网络(ChatGPT/翻译软件)
- 一个是挖掘图像特征信息的卷积神经网络(人脸识别/医学影像识别/自动驾驶)
卷积神经网络(Convolutional Neural Network,CNN)有四种应用场景:
1、图像分类
2、目标检测
3、语义分割
4、实例分割
一 卷积神经网络基础知识
-
网络整体架构
一种多层的监督学习神经网络,分为两大部分:
特征提取模块:由卷积层+池化层+激活函数堆叠而成
映射分类模块:由全连接层+激活函数+分类器组成
采用随机梯度下降法最小化损失函数对网络中的权重参数逐层反向调节,通过多次迭代训练提高网络的性能。
第一个全连接层的输入是由特征提取模块的特征图像。最后一层是一个分类器,可以采用逻辑回归,Softmax 回归甚至是支持向量机对输入图像进行分类。 -
局部感受野+权值共享
目的是简化网络参数并使得网络具有一定程度的位移、尺度、缩放、非线性形变稳定性
1)局部感受野:由于像素的空间关系具有局部性,所以每个神经元不需要同时对全部的像素进行特征提取,只需感受局部特征即可,最后在更高层将这些局部特征综合起来就可以得到整图的信息,这样可以减少连接的数目。
2)权值共享:不同神经元之间的参数共享可以减少需要求解的参数,使用多种滤波器去卷积图像就会得到多种特征映射。权值共享其实就是对图像用同样的卷积核进行卷积操作,也就意味着第一个隐藏层的所有神经元所能检测到处于图像不同位置的完全相同的特征。其主要的能力就能检测到不同位置的同一类型特征,也就是卷积网络能很好的适应图像的小范围的平移性,即有较好的平移不变性(比如将输入图像的猫的位置移动之后,同样能够检测到猫的图像)
感觉写得很深奥的样子……等股票解套了!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!心情好点,再图文并茂吧、