算法收敛性、梯度下降与正规方程组、凸函数性质(机器学习先修知识,方便理解)

本文探讨了算法收敛性在迭代法中的应用,介绍了常见的迭代法如牛顿法、梯度下降法等,并对比了梯度下降法与正规方程组在求解函数最小值时的优劣。此外,还讲解了凸函数及其在优化问题中的作用。

算法收敛性

算法收敛性在迭代法中的一个概念。
迭代是数值分析中通过从一个初始估计出发寻找一系列近似解来解决问题(一般是解方程或者方程组)的过程,为实现这一过程所使用的方法统称为迭代法(Iterative Method)。
跟迭代法相对应的是直接法(或者称为一次解法),即一次性的快速解决问题,例如通过开方解决方程x+3= 4。一般如果可能,直接解法总是优先考虑的。但当遇到复杂问题时,特别是在未知量很多,方程为非线性时,我们无法找到直接解法(例如五次以及更高次的代数方程没有解析解,参见阿贝耳定理),这时候或许可以通过迭代法寻求方程(组)的近似解。
最常见的迭代法是牛顿法。其他还包括最速下降法、共轭迭代法、变尺度迭代法、最小二乘法、线性规划、非线性规划、单纯型法、惩罚函数法、斜率投影法、遗传算法、模拟退火等等。[1]^{[1]}[1]

梯度下降与正规方程组

两种都是求解函数的最小值的方法。后者是在最小二乘法中使用的方法。

梯度下降法正规方程组法
学习率需要选择学习速率,不设置会有默认值
迭代需要多次迭代一次求导得出
学习率需要选择学习速率,不设置会有默认值一次求导得出,不需迭代
数据量特征数量n很大也较好适用需要计算(XT^TTX)−1^{-1}1 如果特征数量n较大则运算代价大,因为矩阵的逆的计算时间复杂度为o(n3)o(n^{3})o(n3) 通常来说当n小于10000时还是可以接受的
适用性适用各种类型的模型只适用于线性模型,不适用与逻辑回归模型等其他模型

凸函数及其性质

凸函数是具有如下特性的一个定义在某个向量空间的凸子集C(区间)上的实值函数f:对其定义域C上的任意两点x1、x2x_1 、x_2x1x2,总有f((x1+x2)/2)≤(f(x1)+f(x2))/2f((x_1+x_2)/2)≤(f(x_1 )+f(x_2))/2f((x1+x2)/2)(f(x1)+f(x2))/2 [3]^{[3]}[3]
凸函数最优化,或叫做凸最优化,凸最小化,是数学最优化的一个子领域,研究定义于凸集中的凸函数最小化的问题。凸最佳化在某种意义上说较一般情形的数学最佳化问题要简单,譬如在凸最佳化中局部最佳值必定是全局最佳值。一般的凸最佳化已经接近简单的线性规划一样直捷易行。许多最佳化问题都可以转化成凸最佳化(凸最小化)问题,例如求凹函数f最大值的问题就等同于求凸函数 -f最小值的问题。 [4]^{[4]}[4]

参考文献:
[1]^{[1]}[1]:https://baike.baidu.com/item/%E8%BF%AD%E4%BB%A3/8415523?fr=aladdin
[2]^{[2]}[2]:https://blog.youkuaiyun.com/GhostintheCode/article/details/93136495
[3]^{[3]}[3]:https://zh.wikipedia.org/wiki/%E5%87%B8%E5%87%BD%E6%95%B0
[4]^{[4]}[4]:https://zh.wikipedia.org/wiki/%E5%87%B8%E5%84%AA%E5%8C%96

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

培之

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值