BP神经网络从推导到实现

最新推荐文章于 2024-02-08 14:52:48 发布

m0_57892392

最新推荐文章于 2024-02-08 14:52:48 发布

阅读量179

点赞数

文章标签：神经网络机器学习深度学习

本文链接：https://blog.youkuaiyun.com/m0_57892392/article/details/119988456

版权

本文深入探讨了BP神经网络，包括其基本结构和反向传播原理。阐述了前向计算、随机梯度下降法和小批量梯度下降法在实现中的作用，并介绍了交叉熵代价函数作为优化手段，以提升网络训练效率。此外，讨论了交叉熵如何解决Sigmoid激活函数在学习初期的慢速问题，并对比了二次代价函数的适用场景。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.BP神经网络的含义

BP(back propagation)神经网络是1986年由Rumelhart和McClelland为首的科学家提出的概念，是一种按照误差逆向传播算法训练的多层前馈神经网络，是应用最广泛的神经网络。

2.BP神经网络结构与原理

2.1BP神经网络的结构

在神经网络中每一个节点的都与上一层的所有节点相连，称为全连接。神经网络的上一层输出的数据是下一层的输入数据。在图中的神经网络中，原始的输入数据，通过第一层隐含层的计算得出的输出数据，会传到第二层隐含层。而第二层的输出，又会作为输出层的输入数据。

对上图元素的解释：

2.2BP神经网络的原理

BP网络能学习和存贮大量的输入-输出模式映射关系，而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法，通过反向传播来不断调整网络的权值和阈值，使网络的误差平方和最小。

3.BP神经网络的第一种实现

3.1前向计算

3.2随机梯度下降法

3.3小批量梯度下降法

3.4反向传播

3.5估值函数

运行结果如下：

4.BP 神经网络的改进和第二种实现

4.1.1 交叉熵代价函数

其中，x表示样本，n表示样本的总数。那么，重新计算参数w的梯度：

其中：

因此，w的梯度公式中原来的被消掉了；另外，该梯度公式中的表示输出值与实际值之间的误差。所以，当误差越大，梯度就越大，参数w调整得越快，训练速度也就越快。同理可得，b的梯度为：

(1) 引入交叉熵代价函数目的是解决一些实例在刚开始训练时学习得非常慢的问题，其

主要针对激活函数为 Sigmod 函数

(2) 如果采用一种不会出现饱和状态的激活函数，那么可以继续使用误差平方和作为损

失函数

(3) 如果在输出神经元是 S 型神经元时，交叉熵一般都是更好的选择

(4) 输出神经元是线性的那么二次代价函数不再会导致学习速度下降的问题。在此情形

下，二次代价函数就是一种合适的选择

(5) 交叉熵无法改善隐藏层中神经元发生的学习缓慢

(6) 交叉熵损失函数只对网络输出 “ 明显背离预期 ” 时发生的学习缓慢有改善效果

(7) 应用交叉熵损失并不能改善或避免神经元饱和， 而是当输出层神经元发生饱和时，

能够避免其学习缓慢的问题。