一、用自己的语言解释以下概念
1.局部感知、权值共享
局部感知:在卷积神经网络中,局部感知是指卷积层中的每个神经元只与前一层中某个局部窗口内的神经元相连,而不是与前一层的所有神经元相连。深层的神经元能感受到前面的局部特征。相较全连接更能提取局部特征。
权值共享:在卷积神经网络中,权值共享是指作为参数的卷积核对于同一层的所有神经元都是相同的。这意味着,无论在哪个位置,都使用相同的卷积核来提取特征,从而减少了参数的数量,降低了模型的复杂度,并提高了计算效率。平移不变性。
2.池化(子采样、降采样、汇聚)。会带来那些好处和坏处?
好处:
减少计算量:池化操作可以减小特征图的尺寸,从而降低后续层级的计算量。
提高计算效率:由于特征图尺寸减小,计算速度会相应提高。
坏处:
信息丢失:池化操作会舍弃部分细节信息,可能导致丢失对分类或定位任务重要的细节。
分辨率下降:池化会导致特征图的尺寸减小,限制网络对输入数据细微变化的感知能力。
3.全卷积网络(课上讲的这个概念不准确,同学们查资料纠正一下)
全卷积网络(Fully Convolutional Networks,FCN)是一种用于图像语义分割的深度学习框架。它将传统卷积神经网络中的全连接层替换为卷积层,使得网络的输出是热力图而非类别标签。
特点:
上采样:为了解决卷积和池化导致的图像尺寸变小问题,FCN使用上采样方式对图像尺寸进行恢复。
跳跃连接:FCN通常使用跳跃连接将浅层特征与深层特征结合,以增强分割的细节表现并改善分割结果的精度。
4.低级特征、中级特征、高级特征
低级特征:在神经网络的浅层或较早的卷积层中提取到的原始、局部的图像特征,如颜色、纹理等。这些特征通常用于描述图像的基本属性。
中级特征:在神经网络的中间层中提取到的特征,它们是对低级特征的组合和抽象。例如,在图像识别中,中级特征可能包括边缘、角点、形状等。
高级特征:在神经网络的深层或后续层中提取到的特征,它们是对中级特征的进一步组合和抽象。高级特征通常具有更强的语义信息,如物体的类别、位置等。
卷积核越来越抽象
5.多通道。N输入,M输出是如何实现的?
多通道:在卷积神经网络中,多通道通常指的是输入张量和输出张量包含多个二维数组,即多个输入通道和多个输出通道。
N输入,M输出的实现:当有N个通道输入时,需要卷积核的通道数是N,卷积核的个数自己定。最后一次卷积有M个卷积核就M输出
6.1×1的卷积核有什么作用
改变通道数:1×1的卷积核可以在不改变特征图大小的情况下,通过调整卷积核的数量来改变输出特征图的通道数。
特征融合:由于1×1的卷积核在每个位置都对所有输入通道进行卷积操作,因此可以将不同通道之间的特征进行融合。
增加非线性:通过引入非线性激活函数,1×1的卷积核可以增加网络的非线性特性,从而增强网络的表达能力。
减少计算量:在某些情况下,使用1×1的卷积核可以减少后续卷积层的计算量,因为可以先通过1×1的卷积核进行降维操作,再进行后续的计算。
二、使用CNN进行XO识别
1.复现参考资料中的代码
我的文件结构
取X150张,O150张放到text里测试
训练:代码链接里的‘训练模型源代码’
测试:代码链接里的“测试模型源代码"
特征图:代码链接里的‘查看训练好的模型的特征图‘
卷积核:代码链接里的’查看训练好的模型的卷积核’
卷积过程:
·116*116*1->114*114*9->57*57*9
·57*57*9->55*55*5->27*27*5(池化计算时是下取整)
·27*27*5->1200
·1200->64
·64->2
- 要留意规格,改代码主要就是配规格
训练: