关于梯度下降法的理解

本文探讨了梯度的概念,如何用梯度表示多变量函数的局部变化趋势,并通过公式θ1=θ0+α▽J(Θ)解释在数值求解中的应用。以函数斜率和学习率为例,展示了单变量和多变量函数的优化过程。关键概念包括梯度方向、收敛条件及学习率的选择。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 求最小值问题

2. 梯度的含义

梯度实际上就是多变量微分的一般化

  • 在单变量的函数中,梯度其实就是函数的微分,代表着函数在某个给定点的切线的斜率
  • 在多变量函数中,梯度是一个向量,向量有方向,梯度的方向就指出了函数在给定点的上升最快的方向

3. 公式

Θ1=Θ0+α▽J(Θ)→evaluatedatΘ0

此公式及时 1 数值求解中的表达式,意义在于,当在Θ0 这个位置时,想要走到Θ1的位置,就要确定梯度,然后走完α这段步长;

依次循环往复,直到收敛,α不能太大也不能太小,太小的话,可能导致迟迟走不到最低点,太大的话,会导致错过最低点!

4. 举例 

4.1 单变量函数

函数值 = 起始点函数值 - 学习率 * 斜率

        这里:学习率* 斜率 就相当于 f(x + 函数值增量(Δx) )

依次循环,直到有f(x+Δx) < f(x) 函数收敛;

在这里插入图片描述

4.2 多变量函数

 

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值