多维度卷积运算精髓

最新推荐文章于 2024-11-09 16:25:19 发布

qq_54581267

最新推荐文章于 2024-11-09 16:25:19 发布

阅读量472

点赞数

CC 4.0 BY-SA版权

文章标签：深度学习 cnn 神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_54581267/article/details/129207946

本文探讨了卷积运算的核心，特别是在多维度卷积核的情况下。重点解析了(c1,c2,1,1)维度卷积核的计算方式，将2D卷积核展开为二维矩阵，并展示了如何将输入数据相应展开以进行矩阵乘法。通过代码示例展示了1x1卷积核如何等效于全连接层的运算，并解释了其在保持输出高宽不变时控制模型复杂度的作用。此外，文章还提到了非1x1卷积核的处理方法，并提供了计算多通道卷积的函数实现。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

卷积运算的精髓在于每一个卷积层的卷积核的维度，特别是多维度的情况下，我们在思考多维度的卷积运算的时候，我们需要先搞明白假如卷积核为（c1,c2,1,1）的这种维度下的情况是如何的？

每一层的卷积核为1维的情况下，这种情况是如何计算的？

请看上图，如图所示，我已经把2*3*1*1的卷积核展开，分别先按照输出通道维数，输入通道维数，接着1*1的矩阵数字展开成一个2维的矩阵，在这种情况下，我们接着把输入数据展开，分别按照输入通道维数，还有每个矩阵按照行和列展开成一个1行的数列，那么这种情况下，我们可以按照如下代码进行乘法运算：

def corr2d_multi_in_out_1x1(X, K):

c_i, h, w = X.shape

c_o = K.shape[0]

X = X.reshape((c_i, h * w))

K = K.reshape((c_o, c_i))

Y = nd.dot(K, X) # 全连接层的矩阵乘法

return Y.reshape((c_o, h, w))

这种情况下，我们就可以让卷积核与输入数据进行矩阵乘法运算，也就是dot运算，最后我们把得出的结果进行重新捏形状，直接就可以变成最终新的矩阵，实例如下：

X = nd.random.uniform(shape=(3, 3, 3))

K = nd.random.uniform(shape=(2, 3, 1, 1))

Y1 = corr2d_multi_in_out_1x1(X, K)

Y1

[[[1.6569827 0.86790574 0.674144 ]

[1.8918769 1.0956942 0.34890684]

[1.2571611 1.3171167 1.7891276 ]]

[[0.69264996 0.43731803 0.18686524]

[0.89936227 0.48084605 0.19427292]

[0.51245344 0.53381854 0.80302143]]]

<NDArray 2x3x3 @cpu(0)>

还有一点特别需要注意的是，我们在定义输入数据的时候，输入数据的高和宽不需要一定和卷积核的高和宽一样，但是输入通道的数目一定要一致。而且看到这里，想必能看出来，我们在定义一个高和宽是1*1的卷积核的时候，会出现输出数据的高和宽不变的情况，那么这种情况是有什么用呢？

当高和宽都是1的时候，我们可以更好的控制模型复杂度，我们不会导致输出数据的形状改变，这个在神经网络前向传播过程中是非常有用的。

而且这种卷积核可以等价与全连接神经网络的矩阵运算，可以把卷积核的通道维当成特征维，因为我们发现，当进行维度是1的2维互相关运算的时候，我们发现只是需要按照卷积窗口大小，让输入数据跟卷积核进行对应位置元素的相乘再相加，那么如果是3个通道的卷积核跟3个通道的输入数据进行运算的时候，我们会发现第一个通道的卷积核跟第一个通道的第一个卷积窗口的数组进行简单乘法加和，然后第二个通道的卷积核跟第二个通道的第一个卷积窗口的乘法加和，第三个通道的卷积核跟第三个通道的第一个卷积窗口的矩阵进行乘法加和，最后再把这三个数字加起来形成输出矩阵的第一个元素，那么我们再回头思考，如果是这种情况的话，我们是否可以把每个通道的1*1的卷积核的数字按照特征值放在第一个通道，第二个通道，第三个通道，这样我们就可以回归到全连接层的矩阵运算方法了

当我们进行某个多层神经网络运算过程中，我们需要在中间进行缩小输出数据的通道数目，但是不想改变高和宽的情况下，我们就需要用到这种1*1的卷积核的方式了，

可以进一步思考，那如果不是1*1的卷积核的方法呢？我们如何展开，依然是一个道理，我们可以按照上述展开卷积核为2维数组的方式去展开，这样运算会加快很多，那么接下来给出一个另类方法，计算多通道的卷积运算。

def corr2d_multi_in(X, K):

# ⾸先沿着X和K的第0维（通道维）遍历。然后使⽤*将结果列表变成add_n函数的位置参数

# （positional argument）来进⾏相加

return nd.add_n(*[d2l.corr2d(x, k) for x, k in zip(X, K)])

def corr2d_multi_in_out(X, K):

# 对K的第0维遍历，每次同输⼊X做互相关计算。所有结果使⽤stack函数合并在⼀起

return nd.stack(*[corr2d_multi_in(X, k) for k in K])

K = nd.stack(K, K + 1, K + 2)

corr2d_multi_in_out(X, K)

out:

[[[ 56. 72.]

[104. 120.]]

[[ 76. 100.]

[148. 172.]]

[[ 96. 128.]

[192. 224.]]]

<NDArray 3x2x2 @cpu(0)>

博客等级

码龄5年

2
原创

0
点赞

0
收藏

1
粉丝

关注

私信

热门文章

下一篇：: 机器学习周志华01day-模型选择和评估

最新评论

机器学习周志华01day-模型选择和评估
优快云-Ada助手: 非常感谢您分享这篇关于机器学习的博客，您的文章解释得非常清楚易懂，让人信手拈来。学习机器学习需要不断地理解和掌握各种模型选择和评估的方法，而这篇博客正好给了我们一个很好的开端。除此之外，我们还可以探索一些扩展知识和技能，如特征选择、交叉验证、集成学习等，这些内容可以让我们更深入地理解机器学习，并且在实践中得到更好的应用。再次感谢您的分享，期待您更多的博客。如何写出更高质量的博客，请看该博主的分享：https://blog.youkuaiyun.com/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
多维度卷积运算精髓
优快云-Ada助手: 推荐 Python入门技能树：https://edu.youkuaiyun.com/skill/python?utm_source=AI_act_python

大家在看

最新文章

机器学习周志华01day-模型选择和评估

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。