约束优化方法

最新推荐文章于 2024-07-06 14:03:10 发布

原创

最新推荐文章于 2024-07-06 14:03:10 发布 · 1.3k 阅读

8 ·

CC 4.0 BY-SA版权

文章标签：

#Machine Learning

本文详细介绍了约束优化问题的最优性条件，包括等式约束、不等式约束以及一般约束问题的KKT条件。通过拉格朗日定理和Farkas引理，阐述了局部极小点的判定准则，并讨论了凸优化问题中KKT点与全局极小点的关系。

约束优化方法

无约束优化
等式约束的最优性条件
不等式约束问题的最优性条件
一般约束问题的最优性条件

无约束优化 $\in \mathbb{R}^{N}$
$min _{x} f(x)$ 有函数解析式时，由Fermat定理，对函数求导令其导数为零,即 $∇xf(x)=0\nabla_{x} f(x)=0$
无函数解析式时，可以通过梯度下降法，牛顿法等迭代方法使沿着负梯度方向下降逐步逼近极小点.

1 $\quad$ 等式约束的最优性条件

$\min f(x) \qquad(1)$ $\text { s.t. } \quad h_{i}(x)=0, i=1,2, \cdots, l$
定理1-1 (拉格朗日定理（KKT条件))假设 $x^*$ 是问题 $(1)$ 的局部极小点， $f (x)$ 和 $hi(x∗)(i=1,2,…,l)h_i(x^*)(i=1,2,\dots,l)$ 在 $x^*$ 的某邻域内连续可微。若向量组 $∇hi(x∗)(i=1,2,…,l)\nabla h_{i}\left(x^{*}\right)(i=1,2,\dots,l)$ 线性无关，则存在乘子向量 $λ∗=(λ1∗,λ2∗,⋯ ,λl∗)T\lambda^{*}=\left(\lambda_{1}^{*}, \lambda_{2}^{*}, \cdots, \lambda_{l}^{*}\right)^{T}$ ，使得 $\nabla_{x} L\left(x^{*}, \lambda^{*}\right)=0$ 即 $\nabla f\left(x^{*}\right)-\sum_{i=1}^{l} \lambda_{i}^{*} \nabla h_{i}\left(x^{*}\right)=0$ 定理1-2 $ \;$ 对于等式约束问题 $(1)$ ，假设 $f (x)$ 和 $hi(x)(i=1,2,…,l)h_i(x)(i=1,2,\dots,l)$ 都是二阶连续可微的，并且存在 $(x∗,λ∗)∈Rn×Rl\left(x^{*}, \lambda^{*}\right) \in \mathbb{R}^{n} \times \mathbb{R}^{l}$ ，使得 $∇L(x∗,λ∗)=0\nabla L\left(x^{*}, \lambda^{*}\right)=0$ 。若对任意的 $\neq d \in \mathbb{R}^{n},\nabla h_{i}\left(x^{*}\right)^{T}d=0 \;(i=1,2,\dots,l)$ ，,均有 $dT∇xx2L(x∗,λ∗)d>0d^{T} \nabla_{x x}^{2} L\left(x^{*}, \lambda^{*}\right) d>0$ 则 $x^*$ 是问题 $(1)$ 的一个严格局部极小点.

2 $\quad$ 不等式约束问题的最优性条件

$\min f(x) \qquad(2)$ $gi(x)≥0,i=1,2,⋯ ,m\text { s.t. } g_{i}(x) \geq 0, i=1,2, \cdots, m$ 记可行域为 $x∈Rn∣gi(x)≥0,i=1,2,⋯ ,n}\mathcal{D}=\left\{x \in \mathbb{R}^{n} | g_{i}(x) \geq 0, i=1,2, \cdots, n\right\}$ ，指标集 $1,⋯ ,m}I=\{1, \cdots, m\}$
不等式约束问题的最优性条件需要用到有效约束和非有效约束的概念。对于一个可行点 $x‾\overline{x}$ ，即 $x‾∈D\overline{x} \in \mathcal{D}$ ，此时可能会出现两种情形。即有效约束函数满足 $gi(x‾)=0g_{i}(\overline{x})=0$ ，而另一些约束函数满足 $gi(x‾)>0g_{i}(\overline{x})>0$ ，对于后一种情形，在 $x‾\overline{x}$ 的某一个领域内仍然保持 $gi(x‾)>0g_{i}(\overline{x})>0$ 成立，而前者不具备这种性质，因此有必要把这两种情形区分开来.

定义1 $ \;$ 若问题 $(1)$ 的一个可行点 $x‾∈D\overline{x} \in \mathcal{D}$ 使得
$gi(x‾)=0g_{i}(\overline{x})=0$ ，则称不等式约束 $gi(x)≥0g_{i}(x) \geq 0$ 为 $x‾\overline{x}$ 有效约束，反之若有 $gi(x‾)>0g_{i}(\overline{x})>0$ ，则称不等式约束为 $g_{i}(x) >0$ 的非有效约束。称集合
$I(\overline{x})=\left\{i : g_{i}(\overline{x})=0\right\}$