Q23: 推导梯度下降
的收敛条件(Lipschitz 连续假设)
梯度下降与 Lipschitz 连续是啥?
梯度下降是一种常用的优化算法,就像在山上找下山的路,每一步都沿着坡度(梯度)最陡的反方向走,公式 中,
是每步走的 “步长”。但如果步长太大,可能会跳过山谷,Lipschitz 连续假设就像是给下山的速度设了个 “限速”,即
(L 是常数),确保函数值不会突然大幅变化。
推导过程
利用泰勒展开式 。要保证每一步都在 “下山”
,整理可得
,解这个不等式得出

最低0.47元/天 解锁文章
458

被折叠的 条评论
为什么被折叠?



