机器学习数学原理（5）——广泛拉格朗日乘子法

X_XZhang

于 2017-05-12 09:55:00 发布

阅读量9.9k

点赞数 8

CC 4.0 BY-SA版权

分类专栏：机器学习算法文章标签：机器学习算法数学

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/z_x_1996/article/details/71705650

这篇博客深入探讨了拉格朗日乘子法在有约束的凸优化问题中的应用，特别是为机器学习中的SVM算法奠定基础。文章首先介绍了拉格朗日乘子法的基本思想，通过数学实例展示了如何将约束优化问题转化为无约束问题。接着，详细讨论了等式约束和不等式约束下的优化问题，包括KKT条件，阐述了如何处理不等式约束。内容结合麻省理工学院的数学课程实例，易于理解。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

机器学习数学原理（5）——广泛拉格朗日乘子法

这一篇博客针对的是有约束的凸优化问题，主要是为后面的最优间隔分类器以及其演化的SVM（支持向量机，Support Vector Machine）算法作铺垫。Andrew Ng在讲解最优间隔分类器时运用了广泛拉格朗日乘子法但并没有讲的十分的明细，而是直接使用了结论，故笔者专门复习了拉格朗日乘子法并且学习了其在不等式约束情况下的优化（即广泛拉格朗日乘子法）。

这里要感谢博主Poll的博文：http://www.cnblogs.com/maybe2030/p/4946256.html。笔者写的是以博主Poll的博文为骨架，同时加上了自己对其的补充，并且解释了原文中很容易引起误解的或者难理解的公式。当然这里也要感谢MIT的在线数学课程，博主Poll的博文正是课程上该内容的笔记。

另外老规矩，由于笔者水平有限，若出现不妥或者错误的地方，欢迎批评指出。

1 拉格朗日乘子法的基本思想

1.1 思想概括

首先我们先要明确这个算法的目的是优化，对于一个连续的函数来说其实就是求全局极值。

现在我们来考虑一下没有约束条件的凸优化问题。对高等数学略有了解的人应该都知道对于一个连续的函数求极值点，其实就应该将函数求导，然后取导数向量为零向量即可。

例如一个n元函数f(x1,x2,…,xn)，记作f(X)，当我们需要求其极值时，便分别求f(X)对于xi的偏导（i=1~n），然后令这n个偏导为零，便将求极值点的问题转化为n个n元方程构成的方程组

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。