5、前馈神经网络：原理、训练与优化

emacs5lisp

于 2025-10-29 11:19:32 发布

阅读量12

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习的贝叶斯之路文章标签：前馈神经网络误差反向传播正则化

本文链接：https://blog.youkuaiyun.com/emacs5lisp/article/details/154631503

机器学习的贝叶斯之路专栏收录该内容

17 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

前馈神经网络：原理、训练与优化

在机器学习领域，前馈神经网络是一种强大的工具，广泛应用于模式识别、回归分析和分类问题。本文将深入探讨前馈神经网络的原理、训练方法以及优化策略。

1. 前馈网络函数

前馈神经网络的基本模型可以通过一系列功能变换来描述。首先，输入变量 $x_1, \cdots, x_D$ 会进行线性组合，得到激活值 $a_j$：
[a_j = \sum_{i=1}^{D} w_{ji}^{(1)} x_i + w_{j0}^{(1)}]
其中，$j = 1, \cdots, M$，$w_{ji}^{(1)}$ 为权重，$w_{j0}^{(1)}$ 为偏置。激活值 $a_j$ 经过非线性激活函数 $h(\cdot)$ 变换，得到隐藏单元的输出 $z_j$：
[z_j = h(a_j)]
常见的非线性函数 $h(\cdot)$ 包括逻辑 sigmoid 函数或 ‘tanh’ 函数。这些隐藏单元的输出再次进行线性组合，得到输出单元的激活值 $a_k$：
[a_k = \sum_{j=1}^{M} w_{kj}^{(2)} z_j + w_{k0}^{(2)}]
其中，$k = 1, \cdots, K$，$K$ 为输出的总数。最后，输出单元的激活值通过合适的激活函数变换，得到网络的输出 $y_k$。激活函数的选择取决于数据的性质和目标变量的分布。

对于标准回归问题，激活函数为恒等函数，即 $y_k = a_k$；对于多二元分类问题，每个输出单元的激活函数为逻辑 sigmoid 函数：
[y_k = \sigma(a_k) = \frac{1}{1 + \exp(-a_k)}]
对于多分类问题，则