输入图片和输出图的高宽没有变的情况下,通常是不会改变通道数的;如果输出图片和输入的高宽都减半的话,输出的通道数会加一倍(空间信息压缩,把提取的信息在更多通道中存起来)
对于输入的通道来说,每个通道对应的二维卷积核是不一样的,对于输出的通道来说,每个通道对应的三维卷积和是一样的
每个通道的卷积核是不一样的,不同通道的卷积核大小是一样的,应该少说了大小两个字把?
每个通道的卷积核的权重是不一样的,不同通道的卷积核大小是一样的
核的参数是学出来的(不是选的)
二维卷积是只有高宽两个
输入通道数=每个核的通道数,输出通道数=卷积核的个数
多少个卷积核跟你卷积的维度没关系
在计算机视觉和深度学习中,特别是在处理图像或视频数据时,通道数(Channels)通常被视为数据的一个维度。在图像处理的上下文中,通道数通常指的是图像的颜色深度或特征深度。
- 对于灰度图像(Grayscale Images),通道数为1,表示图像中的每个像素点仅由一个亮度值组成,没有颜色信息。
- 对于彩色图像,最常见的格式是RGB(红、绿、蓝)颜色模型,此时通道数为3,分别对应红色、绿色和蓝色三个颜色通道。其他颜色模型,如RGBA(增加了透明度通道),则具有4个通道。
在深度学习模型中,尤其是在卷积神经网络(CNN)中,输入数据(如图像)被视作多维数组(也称为张量),其维度通常包括:
- 批次大小(Batch Size):这是数据批量处理时的一个维度,表示一次处理多少张图像。
- 高度(Height):图像的高度。
- 宽度(Width):图像的宽度。
- 通道数(Channels):如上所述,表示图像的颜色深度或特征深度。
因此,在这个上下文中,通道数确实被视为数据的一个维度。对于处理图像或视频数据的深度学习模型来说,理解和处理这个维度是至关重要的。
卷积是可以获取位置信息的(对位置信息很敏感)
同一卷积层共享参数,通道之间的不共享
feature map就是卷积的输出
_module是一个特殊的容器,里面存着一层一层的层或者块
这里只是告诉各位,可以灵活的将各种块组合在一起,比如将刚刚定义的NestMLP、线性层以及之前定义的FixedHiddenMLP连在一起。
权重是一个状态(因为权重可以改变)
测试数据集来验证模型的好坏
1e-6
是一种在科学计数法中表示非常小的数字的方式。具体来说,1e-6
等于 1×10−6,也就是 0.000001。这种表示法常用于编程、科学计算、物理学、工程学等领域,以便于处理非常大或非常小的数值,避免直接使用大量零的浮点数表示,从而提高数值计算的准确性和可读性。