神经网络各参数矩阵大小的计算总结

这篇博客探讨了深度学习中矩阵运算的原理,包括权重矩阵W[l]、偏置b[l]的形状计算,以及前向传播过程中Z[l]和A[l]的计算。内容涉及输入X和输出Y的维度,以及激活函数的应用,揭示了神经网络层数、节点数量与样本数量之间的关系。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

假设:
矩阵层数为lll,所在层的node个数为n(l)n^{(l)}n(l),X: input, Y: output,样本个数为mmm,有以下的矩阵大小的计算方法:
W[l].shape=(n[l],n[l−1])W^{[l]}.shape = (n^{[l]}, n^{[l-1]})W[l].shape=(n[l],n[l1])
X.shape=(n[0],1)X.shape = (n^{[0]}, 1)X.shape=(n[0],1)
Y.shape=(n[l],1)Y.shape = (n^{[l]}, 1)Y.shape=(n[l],1), l取层数最大值
Z[l]=W[l]A[l−1]+b[l]Z^{[l]}= W^{[l]}A^{[l-1]} + b^{[l]}Z[l]=W[l]A[l1]+b[l]
A[l]=activation(Z[l])A^{[l]} = activation(Z^{[l]})A[l]=activation(Z[l])
Z[l].shape=A[l].shape=(n[l],m)Z^{[l]}.shape = A^{[l]}.shape = (n^{[l]}, m)Z[l].shape=A[l].shape=(n[l],m)
b[l].shape=(n[l],1)b^{[l]}.shape = (n^{[l]}, 1)b[l].shape=(n[l],1)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值