“梯度下降法”理解

本文介绍了梯度下降法在神经网络反向传播中的应用,阐述了方向导数的概念,解释了如何通过方向导数求解函数沿指定方向的变化率,并探讨了梯度在寻找函数极值点中的作用。通过理解方向导数和梯度,可以更好地掌握梯度下降法的原理和应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在学习神经网络的时候,反向传播,通常会用到梯度下降法去更新权值使得在不断迭代的过程中使得每层网络权值不断调整直到损失函数落入最小值(局部或全局)。

梯度下降法的基本公式是:

w:=wηE

其中 E 为损失函数, η 为步长,下面解释上式如何理解,需要从方向导数开始讲起。

方向导数

偏导数反映的是函数研坐标轴方向的变化率,但仅考虑函数沿坐标轴方向但变化率是不够的。例如热空气要向冷空气的地方流动,气象学中就要确定大气温度、气压沿着某些方向的变化率。因此我们有必要来讨论函数沿任一指定方向的变化率问题。

如下图, l xOy 平面上过 P0 点的直线, el 为与直线 l 同方向的单位向量, el=(cosα,cosβ)

这里写图片描述

则射线 l 的参数方程为:

{x=x0+tcosαy=y0+tcosβ (t0)

则定义:
P 沿 l 趋于 P0 (即 t0+ )时的极限存在,那么称此极限为函数 f(x,y) 在点 P0 沿方向 l 的方向导数,记作 fl|(x0,y0) ,即

fl|(x0,y0)=limt0+f(x0+tcosα,y0+tcosβ)f(x0,
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值