机器学习(三):拉格朗日乘子与梯度下降法

本文介绍了机器学习中的拉格朗日乘子法和梯度下降法。拉格朗日乘子法用于解决带有约束条件的优化问题,通过构造拉格朗日函数来转化原问题。梯度下降法是求解无约束优化问题的常用方法,包括标准梯度下降、随机梯度下降和Mini-batch梯度下降等,用于迭代寻找目标函数的最小值。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

这里介绍两个在以后的机器学习算法中经常使用的技巧:拉格朗日乘子(Lagrange multiplier)和梯度下降法(Gradient descent)。

1. 拉格朗日乘子法

拉格朗日乘子被⽤于寻找多元变量在⼀个或者多个限制条件下的驻点。

1.1 等式约束条件

考虑这样一个问题:
求解f(x1,x2)的最大值,其中x1和x2必须满足如下限制条件:g(x1,x2)=0

求解方法1:将g(x1,x2)=0转化为x2=h(x1)带入f函数,然后使用微分法求解驻点x1,然后得到驻点x2=h(x1)
这种⽅法的⼀个问题是,把x2显式地表⽰为x1的函数,即找到限制⽅程的解析解很困难。并且,这种⽅法把x1和x2区别对待,这破坏了这些变量之间⾃然存在的对称性。

由此我们引入拉格朗日乘子法。

1.1.1 约束条件g(x)=0的特性

设向量xRD,则g(x)=0表示一个D-1维的曲面。

g(x)

证明: 考虑⼀个位于限制曲⾯上的点x以及这个点附近同样位于曲⾯上的点x + ϵ。如
果我们在点x处进⾏泰勒展开,那么我们有

g(x+ϵ)g(x)+ϵT>g(x)
我们有:
g(x+ϵ)=g(x)=0ϵTg(x)>0
ϵ0ϵTg(x)=0

ϵ 平行于曲面,所以 g(x) 正交于曲面。

1.1.2 原问题转化为拉格朗日函数

这里写图片描述
在g(x)=0上寻找一个x,使得f(x)最大。必然有f(x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值