6、神经网络入门：核心概念与Keras实践

最新推荐文章于 2025-12-16 20:48:58 发布

火锅TCP

最新推荐文章于 2025-12-16 20:48:58 发布

阅读量15

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习入门实战指南文章标签：神经网络梯度下降反向传播

本文链接：https://blog.youkuaiyun.com/r7s8t/article/details/154815398

深度学习入门实战指南专栏收录该内容

31 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

神经网络入门：核心概念与Keras实践

1. 神经网络的优化引擎：基于梯度的优化

在神经网络中，基于梯度的优化是核心机制。在参数空间中，存在局部最小值和全局最小值。当使用小学习率的随机梯度下降（SGD）优化参数时，优化过程可能会陷入局部最小值，而无法达到全局最小值。

为避免这种情况，可以引入动量（momentum）的概念。动量的灵感来源于物理学，可将优化过程想象成一个小球在损失曲线上滚动。如果小球具有足够的动量，它就不会陷入山谷，而是最终到达全局最小值。

以下是一个简单的动量实现代码：

past_velocity = 0.
momentum = 0.1
while loss > 0.01:
    w, loss, gradient = get_current_parameters()
    velocity = past_velocity * momentum + learning_rate * gradient
    w = w + momentum * velocity - learning_rate * gradient
    past_velocity = velocity
    update_parameter(w)