机器学习笔记（XVIII）神经网络（V）全局最小局部极小

最新推荐文章于 2025-03-06 20:57:19 发布

王先生的副业

最新推荐文章于 2025-03-06 20:57:19 发布

阅读量2.3k

点赞数

分类专栏：机器学习机器学习文章标签：神经网络机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/uncle_gy/article/details/78926577

版权

机器学习同时被 2 个专栏收录

46 篇文章

订阅专栏

39 篇文章

订阅专栏

训练集上的误差

使用 $E$ 表示神经网络在训练集合上的误差，则 $E$ 是关于连接权值 $\mathbf{w}$ 和阈值 $\theta$ 的函数。

最优

对 $\mathbf{w}^*$ 和 $\theta^*$ 若存在 $\epsilon\gt0$ 使得，

\forall (w; θ) \in {(w; θ) ∣ | | (w; θ) - (w *; θ *) | | \leq ϵ},

$\forall(\mathbf{w};\theta)\in\left\{(\mathbf{w};\theta)\mid||(\mathbf{w};\theta)-(\mathbf{w}^*;\theta^*)||\leq\epsilon\right\},$ 都有

E(w;θ)≥E(w∗;θ∗) $E(\mathbf{w};\theta)\geq E(\mathbf{w}^*;\theta^*)$ 成立，则

(w∗;θ∗) $(\mathbf{w}^*;\theta^*)$ 为 局部极小解，若对于参数空间内中的任意

(w∗;θ∗) $(\mathbf{w}^*;\theta^*)$ 都有

E(w;θ)≥E(w∗;θ∗) $E(\mathbf{w};\theta)\geq E(\mathbf{w}^*;\theta^*)$ 成立，则

(w∗;θ∗) $(\mathbf{w}^*;\theta^*)$ 为 全局最小解。

跳出局部极小值

多个出发点

以多组不同参数值初始化多个神经网络，按照标准方法训练之后，取其中误差最小的解作为最终参数，这相当于从不同的初始点开始搜索，这样就有可能陷入不同的局部最小值，从中选择有可能获得更接近全局最小的结果。

模拟退火

模拟退火，每一步都以一定的概率接受比当前更差的结果，从而有助于“跳出”局部最小，在每一步的迭代中，接受“次优解”的概率要随着时间推移而降低，从而保证算法稳定。

随机梯度下降

随机梯度下降法与标准的梯度下降法不同，随机梯度下降法在计算梯度时加入了随机因素，于是即使陷入局部极小值点，它计算出的结果仍可能不为 0 <script type="math/tex" id="MathJax-Element-1064">0</script>,这样就可能有机会跳出局部极小值点继续搜索。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。