26学习小记

输入图片和输出图的高宽没有变的情况下,通常是不会改变通道数的;如果输出图片和输入的高宽都减半的话,输出的通道数会加一倍(空间信息压缩,把提取的信息在更多通道中存起来)

对于输入的通道来说,每个通道对应的二维卷积核是不一样的,对于输出的通道来说,每个通道对应的三维卷积和是一样的 

每个通道的卷积核是不一样的,不同通道的卷积核大小是一样的,应该少说了大小两个字把? 

 每个通道的卷积核的权重是不一样的,不同通道的卷积核大小是一样的

核的参数是学出来的(不是选的)

二维卷积是只有高宽两个 

输入通道数=每个核的通道数,输出通道数=卷积核的个数 

多少个卷积核跟你卷积的维度没关系

在计算机视觉和深度学习中,特别是在处理图像或视频数据时,通道数(Channels)通常被视为数据的一个维度。在图像处理的上下文中,通道数通常指的是图像的颜色深度或特征深度。

  • 对于灰度图像(Grayscale Images),通道数为1,表示图像中的每个像素点仅由一个亮度值组成,没有颜色信息。
  • 对于彩色图像,最常见的格式是RGB(红、绿、蓝)颜色模型,此时通道数为3,分别对应红色、绿色和蓝色三个颜色通道。其他颜色模型,如RGBA(增加了透明度通道),则具有4个通道。

在深度学习模型中,尤其是在卷积神经网络(CNN)中,输入数据(如图像)被视作多维数组(也称为张量),其维度通常包括:

  1. 批次大小(Batch Size):这是数据批量处理时的一个维度,表示一次处理多少张图像。
  2. 高度(Height):图像的高度。
  3. 宽度(Width):图像的宽度。
  4. 通道数(Channels):如上所述,表示图像的颜色深度或特征深度。

因此,在这个上下文中,通道数确实被视为数据的一个维度。对于处理图像或视频数据的深度学习模型来说,理解和处理这个维度是至关重要的。

卷积是可以获取位置信息的(对位置信息很敏感) 

同一卷积层共享参数,通道之间的不共享

feature map就是卷积的输出 

_module是一个特殊的容器,里面存着一层一层的层或者块 

这里只是告诉各位,可以灵活的将各种块组合在一起,比如将刚刚定义的NestMLP、线性层以及之前定义的FixedHiddenMLP连在一起。

权重是一个状态(因为权重可以改变) 

测试数据集来验证模型的好坏 

 


1e-6 是一种在科学计数法中表示非常小的数字的方式。具体来说,1e-6 等于 1×10−6,也就是 0.000001。这种表示法常用于编程、科学计算、物理学、工程学等领域,以便于处理非常大或非常小的数值,避免直接使用大量零的浮点数表示,从而提高数值计算的准确性和可读性。 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值