
假设输入层有3个节点,隐藏层分别是4个和3个节点,输出层有2个节点。为了简便表示我们忽略激活函数。
$w _ { 1 } ^ { 1 } = \left[ w_{11} , w_{12} , w_{13} \right] ^ { T } ,
w _ { 2 } ^ { 1 } = \left[ w_{21} , w_{22} , w_{23}\right] ^ { T } ,
w _ { 3 } ^ { 1 } = \left[w_{31} , w_{32} , w_{33} \right] ^ { T } ,
w _ { 4 } ^ { 1 } = \left[w_{41} , w_{42} , w_{43}\right] ^ { T }$
计算过程
1. 输入层到第一个隐藏层(4个节点)
- 输入向量 x 的维度为
3x1。 - 第一个隐藏层的权值矩阵 W1 的维度为
4x3(每个输入节点连接到每个隐藏节点)。 - 偏置向量 b1 的维度为
4x1。
w1未转置就应该是
【3,4】,下图是直接转置了。

2. 第一个隐藏层到第二个隐藏层(3个节点)
- 第一个隐藏层的输出 a1 是
4x1向量。 - 第二个隐藏层的权值矩阵 W2 的维度为
3x4(每个第一个隐藏层节点连接到每个第二个隐藏层节点)。 - 偏置向量 b2 的维度为
3x1。 - 图中的w已经被转置

3. 第二个隐藏层到输出层(2个节点)
- 第二个隐藏层的输出 a2 是
3x1向量。 - 输出层的权值矩阵 W3 的维度为
2x3(每个第二个隐藏层节点连接到每个输出节点)。 - 偏置向量 b3 的维度为
2x1。


参数量:
这里计算的是b1,b2,b3……w1,w2,w3……
输入到第一层得参数量:(3+1)*4
第一层到第二层参数量:(4+1)*3=15
第二层到输出参数量:(3+1)*2=8
那有多少个W,B?
L1 4、4
L2 3、3
1059

被折叠的 条评论
为什么被折叠?



