26学习小记

weixin_50270824

于 2024-07-26 20:17:34 发布

阅读量321

点赞数 3

文章标签：学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_50270824/article/details/140715289

版权

输入图片和输出图的高宽没有变的情况下，通常是不会改变通道数的；如果输出图片和输入的高宽都减半的话，输出的通道数会加一倍（空间信息压缩，把提取的信息在更多通道中存起来）

对于输入的通道来说，每个通道对应的二维卷积核是不一样的，对于输出的通道来说，每个通道对应的三维卷积和是一样的

每个通道的卷积核是不一样的，不同通道的卷积核大小是一样的，应该少说了大小两个字把？

每个通道的卷积核的权重是不一样的，不同通道的卷积核大小是一样的

核的参数是学出来的（不是选的）

二维卷积是只有高宽两个

输入通道数=每个核的通道数，输出通道数=卷积核的个数

多少个卷积核跟你卷积的维度没关系

在计算机视觉和深度学习中，特别是在处理图像或视频数据时，通道数（Channels）通常被视为数据的一个维度。在图像处理的上下文中，通道数通常指的是图像的颜色深度或特征深度。

对于灰度图像（Grayscale Images），通道数为1，表示图像中的每个像素点仅由一个亮度值组成，没有颜色信息。
对于彩色图像，最常见的格式是RGB（红、绿、蓝）颜色模型，此时通道数为3，分别对应红色、绿色和蓝色三个颜色通道。其他颜色模型，如RGBA（增加了透明度通道），则具有4个通道。

在深度学习模型中，尤其是在卷积神经网络（CNN）中，输入数据（如图像）被视作多维数组（也称为张量），其维度通常包括：

批次大小（Batch Size）：这是数据批量处理时的一个维度，表示一次处理多少张图像。
高度（Height）：图像的高度。
宽度（Width）：图像的宽度。
通道数（Channels）：如上所述，表示图像的颜色深度或特征深度。

因此，在这个上下文中，通道数确实被视为数据的一个维度。对于处理图像或视频数据的深度学习模型来说，理解和处理这个维度是至关重要的。

卷积是可以获取位置信息的（对位置信息很敏感）

同一卷积层共享参数，通道之间的不共享

feature map就是卷积的输出

_module是一个特殊的容器，里面存着一层一层的层或者块

这里只是告诉各位，可以灵活的将各种块组合在一起，比如将刚刚定义的NestMLP、线性层以及之前定义的FixedHiddenMLP连在一起。

权重是一个状态（因为权重可以改变）

测试数据集来验证模型的好坏

1e-6 是一种在科学计数法中表示非常小的数字的方式。具体来说，1e-6 等于 1×10−6，也就是 0.000001。这种表示法常用于编程、科学计算、物理学、工程学等领域，以便于处理非常大或非常小的数值，避免直接使用大量零的浮点数表示，从而提高数值计算的准确性和可读性。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。