机器学习面试题（3）卷积计算中的参数计算方法？

最新推荐文章于 2025-04-11 18:34:15 发布

磨牙的小朋友

最新推荐文章于 2025-04-11 18:34:15 发布

阅读量771

点赞数

文章标签：卷积神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/my0npencv13poor/article/details/104538300

版权

本文探讨了在深度学习中使用3x3卷积核的原因。3x3卷积核能有效捕捉像素的八邻域信息，通过堆叠可以形成更大的感受野，同时保持较少的参数数量和增加非线性表达能力，对于构建高效深度学习模型具有重要意义。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1 为什么要使用3*3的卷积核？
(1)3x3是最小的能够捕获像素八邻域信息的尺寸。
(2)两个3x3的堆叠卷基层的有限感受野是5x5；三个3x3的堆叠卷基层的感受野是7x7，故可以通过小尺寸卷积层的堆叠替代大尺寸卷积层，并且感受野大小不变。
(3)多个3x3的卷基层比一个大尺寸filter卷基层有更多的非线性（更多层的非线性函数，使用了3个非线性激活函数）。
(4)多个3x3的卷积层比一个大尺寸的filter有更少的参数，如三个3x3的卷积层参数个数3x((3x3xC)xC)=27C2；一个（7x7xC）xC的卷积层参数为49C2。唯一的不足是，在进行反向传播时，中间的卷积层可能会导致占用更多的内存；

第四条详解：假设该卷积层的卷积核为3×3，为了清晰明了假设卷积层的输入和输出的特征图（featuremap）大小（其实是channel通道数）分别为C1，C2。说明：卷积核的应该是一个多维的矩阵K×K×channels，其中channels是由输入的featuremap的通道数决定的，而卷积层中卷积核的个数是由输出的featuremap的通道数决定的，所以该卷积层的参数量是：（3×3×C1）× C2，说明:
（3×3×C1） —— 是每一个卷积核的参数量；
× C2 —— 是总共C2个卷积核；

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。