2025_NIPS_Nonlinearly Preconditioned Gradient Methods: Momentum and Stochastic Analysis

文章主要内容与创新点总结

核心内容

本文聚焦光滑非凸优化问题,研究非线性预处理梯度方法,重点分析类Sigmoid预处理子(自带梯度裁剪特性),提出带动量的改进算法和随机变体,并通过理论推导与实验验证其有效性。

关键创新点
  1. 提出带动量的非线性预处理梯度算法(m-NPGM),基于各向异性下降不等式,放宽传统Lipschitz光滑性约束,适用更广泛函数类。
  2. 推导该算法在非凸场景下的收敛保证,在广义PL条件下实现线性收敛,且动量设计(预处理梯度的凸组合)区别于传统方法。
  3. 构建随机变体算法,在更宽松的噪声假设(弱于有界方差)下证明收敛性,同时覆盖各向同性与可分参考函数。
  4. 实验验证(神经网络训练、矩阵分解等任务)表明,所提方法(如HGD、iHGDm)性能优于SGD、Adam等基线方法。

翻译部分(Markdown格式)

Abstract

我们研究适用于光滑非凸优化问题的非线性预处理梯度方法,重点关注类Sigmoid预处理子——这类预处理子本质上实现了一种梯度裁剪,与广泛使用的梯度裁剪技术类似。基于这一思路,我们提出一种新型重球型(heavy ball-type)算法,并在广义光滑性条件下提供收敛保证。该广义光滑性条件比传统Lipschitz光滑性约束更宽松,因此能覆盖更广泛的函数类。此外,我们还开发了基

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值