对于条件极值问题,当条件形式较为简单时可以采用消元法,将多元函数求条件极值问题转化为单变量函数的极值问题。但当问题的维数增加以及限制条件变得更加复杂的时候,消元法往往难以求解。下面介绍一个求条件极值问题的常用方法——拉格朗日乘数法。
考虑模型:二元函数在平面曲线上的极值
求二元函数
在讲解之前先明确几个《高等数学》中的概念
- 对于二元函数 梯度为其两个偏导数组成的向量
,其
函数值增长最快的方向,相应的梯度的反向对应函数值下降最快的方向;梯度的模对应增长率。;梯度的方向代表
- 对于平面曲线
,其对应于曲面
被平面
所截的曲线;在曲线上的梯度
法向量;曲线的方向向量与法向量垂直,为对应于曲线的
。
为方便理解,下面的讲解希望尽量通过几何意义来使得公式的导出更加形象化,为此不得不放弃一些严谨性。
用符号

如上图所示,当点沿着曲线
时(
点),点沿着
的方向移动,
的值会增大;
时(
点),点沿着
的方向移动,
的值会减小;
时(
点),此时该点对应函数
在
上的一个条件极值点。
可以看出取极值的必要条件是
其中,第一个等式的意义是
当问题由二维变成三维的时候,
此时上面的第一个式子对应着两个约束等式,为方便求解这个方程组,我们引入一个辅助变量
于是
此外我们引入拉格朗日函数的概念
进一步将
[例1] 用拉格朗日乘数法求解下面条件极值问题
由拉格朗日乘数法将原条件极值问题转化成方程组的求解,写出拉格朗日函数
对应的方程组为
求解方程组
于是函数
更一般的情况,对于n元函数和m个等式约束的条件极值问题,拉格朗日函数如下
可将问题转化为求解一个有
该方程组的解对应原条件极值问题的极值点。
以上讨论的范围都是限制条件为等式的情况,而在机器学习领域中的模型往往都是带不等式约束的,不等式约束条件极值问题的拉格朗日乘数法将在下次更新中讨论。
最后,第一次在知乎写文章,不当之处请多指正。◕‿◕。
本文介绍了拉格朗日乘数法在解决多元函数条件极值问题中的作用,特别是在二维和三维空间中的应用。通过几何意义解释了梯度向量与曲线法向量的关系,阐述了当点处切线方向与梯度向量垂直时,该点可能为条件极值点。拉格朗日乘数法通过引入辅助变量简化了求解过程,将条件极值问题转化为方程组的求解,适用于高维和复杂约束情况。并给出了一个实例展示如何运用这种方法求解实际问题。
2269

被折叠的 条评论
为什么被折叠?



