定理3.5(强凸函数的共轭函数)
假设fff是一个闭的μ\muμ-强凸函数,则:
(1)f∗f^*f∗对于所有的yyy都有定义,即dom f∗=Rndom\,f^*=\mathbb{R}^ndomf∗=Rn
(2)f∗f^*f∗是处处可微的,且有梯度
∇f∗(y)=argmaxx (yTx−f(x))
\nabla f^*(y)=\underset{x}{argmax} \:(y^Tx-f(x))
∇f∗(y)=xargmax(yTx−f(x))(3)∇f∗\nabla f^*∇f∗是Lipschitz连续的(设对偶范数为∣∣⋅∣∣∗||\cdot||_*∣∣⋅∣∣∗):
∣∣∇f∗(y)−∇f∗(y′)∣∣≤1μ∣∣y−y′∣∣∗∀y,y′
||\nabla f^*(y)-\nabla f^*(y')||\le \frac{1}{\mu}||y-y'||_*\qquad \forall y,y'
∣∣∇f∗(y)−∇f∗(y′)∣∣≤μ1∣∣y−y′∣∣∗∀y,y′
证明:
若fff是闭的强凸函数
- 对于每个y,yTx−f(x)y^Tx-f(x)yTx−f(x) 仅有一个最大值点(因为是强凹函数)
- x使得yTx−f(x)y^Tx-f(x)yTx−f(x)取到最大值当且仅当y∈∂f(x)y\in \partial f(x)y∈∂f(x),由定理3.3
y∈∂f(x) ⟺ x∈∂f∗(y)={∇f∗(y)} y\in \partial f(x) \iff x\in\partial f^*(y)=\{\nabla f^*(y)\} y∈∂f(x)⟺x∈∂f∗(y)={∇f∗(y)}因此∇f∗(y)=argmaxx(yTx−f(x))\nabla f^*(y)=argmax_x(y^Tx-f(x))∇f∗(y)=argmaxx(yTx−f(x)) - 由定理3.4(一阶条件),若y∈∂f(x),y′∈∂f(x′)y\in \partial f(x),y'\in \partial f(x')y∈∂f(x),y′∈∂f(x′),则有
f(x′)≥f(x)+yT(x′−x)+μ2∣∣x′−x∣∣2f(x)≥f(x′)+(y′)T(x−x′)+μ2∣∣x−x′∣∣2 \begin{aligned} f(x')&\ge f(x)+y^T(x'-x)+\frac{\mu}{2}||x'-x||^2 \\ f(x)&\ge f(x')+(y')^T(x-x')+\frac{\mu}{2}||x-x'||^2 \end{aligned} f(x′)f(x)≥f(x)+yT(x′−x)+2μ∣∣x′−x∣∣2≥f(x′)+(y′)T(x−x′)+2μ∣∣x−x′∣∣2将两个不等式相加,则有
μ∣∣x−x′∣∣2≤(y−y′)T(x−x′)≤∣∣y−y′∣∣∗∣∣x−x′∣∣ \mu||x-x'||^2\le (y-y')^T(x-x')\le ||y-y'||_*||x-x'|| μ∣∣x−x′∣∣2≤(y−y′)T(x−x′)≤∣∣y−y′∣∣∗∣∣x−x′∣∣则(3)成立。
本文详细探讨了强凸函数的共轭函数性质,包括共轭函数的定义域、可微性和Lipschitz连续性。通过定理3.5的证明,阐述了在闭的μ-强凸函数情况下,共轭函数的梯度存在唯一最大值点,并满足特定的不等式关系。
986

被折叠的 条评论
为什么被折叠?



