channel与卷积核的理解

最新推荐文章于 2023-12-20 15:21:36 发布

原创最新推荐文章于 2023-12-20 15:21:36 发布 · 1.3k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

部署运行你感兴趣的模型镜像

1. channel理解

最初输入的图片样本的 channel，取决于图片类型，比如RGB。卷积核中的 in_channels，就是要操作的图像数据的feather map张数，也就是卷积核的深度。也就是上一次卷积的out_channels。

如果是第一次做卷积，就是样本图片的channels，卷积操作完成后输出的 out_channels，取决于卷积核的数量（下层将产生的feather map数量）。此时的 out_channels 也会作为下一次卷积时的卷积核的in_channels。

在CNN中，想搞清楚每一层的传递关系，主要就是 height, width 和 channels 的变化情况。

2. 卷积核为什么有多个？

我们希望在同一层建立起对图片的完整描述，与数学上构造一组基相似。在同一层，我们希望得到对于一张图片多种角度的描述，具体来讲就是用多种不同的卷积核对图像进行卷，得到不同核（这里的核可以理解为描述）上的响应，作为图像的特征。他们的联系在于形成图像在同一层次不同基上的描述。

3. 为什么一般随着层数的加深，卷积核的深度会加深，即卷积核变多？

随着网络的加深，feature map 的长宽尺寸缩小，本卷积层的每个map所提取的特征越具有代表性（精华部分），所以后一层的卷积需要增加feature map 的数量，才能更为充分的提取前一层的特征，一般是成倍增加。

您可能感兴趣的与本文相关的镜像

Qwen-Image

Qwen-Image

图片生成

Qwen

Qwen-Image是阿里云通义千问团队于2025年8月发布的亿参数图像生成基础模型，其最大亮点是强大的复杂文本渲染和精确图像编辑能力，能够生成包含多行、段落级中英文文本的高保真图像

博客等级

码龄8年

25
原创

14
点赞

26
收藏

4
粉丝

关注

私信

热门文章

下一篇：: 科技书单

大家在看

最新文章

AI算力推荐

Qwen-Image

Qwen-Image是阿里云通义千问团队于2025年8月发布的亿参数图像生成基础模型，其最大亮点是强大的复杂文本渲染和精确图像编辑能力，能够生成包含多行、段落级中英文文本的高保真图像

图片生成

Qwen

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。