机器学习入门（7）——神经网络的学习(Neural Networks: Learning)

最新推荐文章于 2025-04-26 16:20:45 发布

原创最新推荐文章于 2025-04-26 16:20:45 发布 · 260 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#神经网络 #机器学习 #反向传播

机器学习专栏收录该内容

16 篇文章

订阅专栏

本文深入解析神经网络优化过程，涵盖代价函数、反向传播算法、梯度检验、随机初始化及综合应用。阐述了如何通过反向传播算法计算代价函数的偏导数，介绍了梯度检验方法确保导数正确，强调了随机初始化的重要性，并总结了神经网络训练的步骤。

代价函数（Cost Function）
反向传播算法（Backpropagation Algorithm）
反向传播算法的直观理解（Backpropagation Intuition）
梯度检验（Gradient Checking）
随机初始化（Random Initialization）
综合起来（Putting It Together）

代价函数（Cost Function）

在这里插入图片描述

反向传播算法（Backpropagation Algorithm）

为了计算代价函数的偏导数 $\frac{\partial}{\partial \Theta_{i j}^{(l)}} J(\Theta)$ ，我们需要采用一种反向传播算法，也就是首先计算最后一层的误差，然后再一层一层反向求出各层的误差，直到倒数第二层。
在这里插入图片描述
首先用正向传播方法计算出每一层的激活单元，利用训练集的结果与神经网络预测的结果求出最后一层的误差，然后利用该误差运用反向传播法计算出直至第二层的所有误差。
我们的算法表示为：

反向传播算法的直观理解（Backpropagation Intuition）

前向传播算法：
反向传播算法

梯度检验（Gradient Checking）

对一个较为复杂的模型（例如神经网络）使用梯度下降算法时，可能会存在一些不容易察觉的错误。虽然代价看上去在不断减小，但最终的结果可能并不是最优解。
为避免这样的问题，我们采取一种叫做梯度的数值检验（Numerical Gradient Checking）方法，通过估计梯度值来检验我们计算的导数值是否真的是我们要求的。
在这里插入图片描述

随机初始化（Random Initialization）

任何优化算法都需要一些初始的参数。初始所有参数为0的方法，对于逻辑回归来说是可行的，但是对于神经网络来说是不可行的。如果我们令所有的初始参数都为0，这将意味着我们第二层的所有激活单元都会有相同的值。同理，如果我们初始所有的参数都为一个非0的数，结果也是一样的。
因此，我们通常初始参数为±ε之间的随机值。