深度学习-核对矩阵维度

最新推荐文章于 2024-08-19 12:41:28 发布

Der_Dream

最新推荐文章于 2024-08-19 12:41:28 发布

阅读量1.1k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：深度学习文章标签：深度学习矩阵维度

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_38525526/article/details/88391947

在深度学习编程中，矩阵维度错误是常见的问题。本文详细介绍了如何检查和确保矩阵维度一致，特别是在五层神经网络中。对于单个训练样本，如输入层2个元素、隐藏层3个元素的情况，各层权重、偏置、激活值等的维度被明确给出。而对于多个训练样本，通过向量化处理，相关变量的维度也会相应变化。理解这些维度关系对于高效且准确的神经网络实现至关重要。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在编写深度神经网络程序时，出现的很多问题都是由于矩阵的维度不对引起的，而且这个问题非常难查。而且python有时候还会改变矩阵的维度（例如之前我们学到的python广播化），所以我们需要经常核对矩阵的维度，使他们的维度与我们预料中的保持一致。
在这里插入图片描述上面是一个五层的神经网络，输入层有2个元素，所以n[0] =2，第一层有三个元素，所以n[1] =3，所以w[1]为(3,2)其他层同理。

因此单个训练样本时各变量的维度公式

w[l] --> (n[l] , n[l-1])

b[l] --> (n[l] , 1)

z[l] --> (n[l] , 1)

a[l] --> (n[l] , 1)

da[l] --> (n[l] , 1)

dz[l] --> (n[l] , 1)

db[l] --> (n[l] , 1)

dw[l] --> (n[l] , n[l-1])

根据上面的公式，下面举例列出第一层的相关变量的维度

W[1] --> (3 , 2)

b[1] --> (3 , 1)

z[1] --> (3 , 1)

a[1]–> (3 , 1)

da[1] --> (3 , 1)

dz[1]–> (3 , 1)

db[1] --> (3 , 1)

dW[1] --> (3 , 2)

那么当多个训练样本时维度公式又是怎么样的呢？多个样本时，我们会通过向量化来提升效率，例如我们会将每个样本的特征x列向量（也就是a[0]）一个一个排起来，组成一个矩阵。

下面给出m个训练样本时的维度公式

W[l] --> (n[l] , n[l-1])

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄8年

23
原创

11
点赞

40
收藏

4
粉丝

关注

私信

热门文章

分类专栏

上一篇：: 深度学习-神经网络激活函数

下一篇：: 深度学习-深度神经网络

最新评论

深度学习-反向传播与梯度下降
星空浩繁: "我们最终的目的是要计算出L关于w和b的偏导数"这样写才对吧
HashMap底层实现与原理解析，JDK1.7与1.8的区别
蓝之刃回复头铁菜鸟: 12+15，如果这次size是11那么这次并不触发扩容啊，所以第十二个还是会加进去。只有下次第十三个来了，此时的size=12，才会触发第一个条件判断
HashMap底层实现与原理解析，JDK1.7与1.8的区别
头铁菜鸟: "由扩容的机制和先插入元素后size++我们可以得出，当数组大小为默认的16时，元素个数最多为27个。" 不是最多26个吗？他是先判断元素个数是否大于等于12后才createEntry吧？所以是11+15吧？

大家在看

字符和字符串全网最详细解释 632

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。