深度学习-Caffe之经典模型详解与实战上面推导的BP神经网络权值更新公式与机器学习(周志华那本有些不一样),因此在这里重新推导一遍,由于优快云的公式编辑器太麻烦,直接照片上传吧!
三层神经网络的拓扑结构如图1所示:
图1 三层神经网络的拓扑结构
隐层的传递函数为
f1(.)
f
1
(
.
)
,输出层的传递函数为
f2(.)
f
2
(
.
)
,
则隐层节点的输出为:
zk=f1(∑ni=0vkixi)
z
k
=
f
1
(
∑
i
=
0
n
v
k
i
x
i
)
;
输出层节点的输出为:
yi=f2(∑qk=0vkjkzk)
y
i
=
f
2
(
∑
k
=
0
q
v
k
j
k
z
k
)
;
第
v
v
个样本的误差为:,其中
tvj
t
j
v
为期望输出;
对
p
p
个样本点额全局误差为:
1、输出层权值跟新
采用累计误差BP算法调整
wjk
w
j
k
,使得全局误差
E
E
<script type="math/tex" id="MathJax-Element-1210">E</script>最小,即:
2隐层权值更新