一、基础知识(3)-共轭函数、次梯度

本文介绍了共轭函数的概念,包括其几何意义和Fenchel不等式,以及二次共轭函数的定义。其次,探讨了次梯度的定义、性质,特别是对于适当凸函数的次微分和方向导数。此外,还阐述了次梯度的基本计算规则,如可微凸函数、凸函数的非负线性组合和线性变量替换的情况。这些概念和性质在优化问题中扮演关键角色。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、共轭函数

1.1 共轭函数的定义和例子

  1. 共轭函数: f ∗ ( y ) = s u p x ∈ d o m f { y T x − f ( x ) } f^*(y)=\underset{x\in dom f}{sup}\{y^Tx-f(x)\} f(y)=xdomfsup{yTxf(x)}
    • 几何意义: x y xy xy f ( x ) f(x) f(x)之间差值的最大值。
      在这里插入图片描述
  2. Fenchel 不等式: f ( x ) + f ∗ ( y ) ⩾ x T y f(x)+f^*(y)\geqslant x^Ty f(x)+f(y)xTy

1.2 二次共轭函数

  1. 二次共轭函数: f ∗ ∗ ( y ) = s u p x ∈ d o m f ∗ { x T y − f ∗ ( x ) } f^{**}(y)=\underset{x\in dom f*}{sup}\{x^Ty-f^*(x)\} f(y)=xdomfsup{xTyf(x)}

二、次梯度

2.1 次梯度的定义

  1. 次梯度:设 f f f为适当凸函数, x x x为定义域 d o m f domf domf中的一个点,若向量 g ∈ R n g\in \R^n gRn满足, f ( y ) ⩾ f ( x ) + g T ( y − x ) , ∀ y ∈ d o m f f(y) \geqslant f(x)+g^T(y-x),\forall y\in domf f(y)f(x)+gT(yx),ydomf,则称 g g g为函数 f f f在点 x x x处的一个次梯度。
  2. 次微分: ∂ f ( x ) = { g ∣ g ∈ R n , f ( y ) ⩾ f ( x ) + g T ( y − x ) , ∀ y ∈ d o m f } \partial f(x)=\{g|g\in \R^n,f(y)\geqslant f(x) + g^T(y-x),\forall y \in domf\} f(x)={ggRn,f(y)f(x)+gT(yx),ydomf}
  3. 形式化理解:对于 f ( x ) = ∣ x ∣ f(x)=|x| f(x)=x,在 x = 0 x=0 x=0的点,无导数,所以可以用次梯度。
    在这里插入图片描述
  4. 次微分: ∂ f ( x ) \partial f(x) f(x)为在 [ a , b ] [a,b] [a,b]区间内的次梯度

2.2 次梯度的性质

  1. 次梯度的单调性: f : R n → R f:\R^n \rightarrow \R f:RnR为凸函数, x , y ∈ d o m f x,y\in dom f x,ydomf,则 μ ∈ ∂ f ( x ) , v ∈ ∂ f ( y ) \mu\in \partial f(x),v\in \partial f(y) μf(x),vf(y)
  2. 待补…

2.3 凸函数的方向导数

  1. f f f为适当函数,给定点 x 0 x_0 x0以及方向 d ∈ R n d\in \R^n dRn,方向导数定义为: l i m ϕ ( t ) t ↓ 0 = l i m t ↓ 0 f ( x 0 + t d ) − f ( x 0 ) t \underset{t\downarrow 0}{lim\phi(t)}=\underset{t\downarrow 0}{lim}\frac{f(x_0+td)-f(x_0)}{t} t0limϕ(t)=t0limtf(x0+td)f(x0)
  2. 方向导数定义: ∂ f ( x 0 ; d ) = i n f t > 0 f ( x 0 + t d ) − f ( x 0 ) t \partial f(x_0;d)=\underset{t>0}{inf}\frac{f(x_0+td)-f(x_0)}{t} f(x0;d)=t>0inftf(x0+td)f(x0)

2.4 次梯度的计算规则

1. 基本规则

  1. 可微凸函数: f f f为凸函数,若 f f f在点 x x x处可微,则 ∂ f ( x ) = { ∇ f ( x ) } \partial f(x)=\{\nabla f(x)\} f(x)={f(x)}
  2. 凸函数的非负线性组合: f 1 , f 2 f_1,f_2 f1,f2为凸函数,且满足 i n t d o m f 1 ∩ d o m f 2 ≠ ∅ , x ∈ d o m f 1 ∩ d o m f 2 int domf_1\cap domf_2 \neq \varnothing,x\in domf_1\cap domf_2 intdomf1domf2=,xdomf1domf2,若 f ( x ) = a 1 f 1 ( x ) + a 2 f 2 ( x ) , a 1 , a 2 ⩾ 0 f(x)=a_1f_1(x)+a_2f_2(x),a_1,a_2\geqslant 0 f(x)=a1f1(x)+a2f2(x),a1,a20,则次微分为 ∂ f ( x ) = a 1 ∂ f 1 ( x ) + a 2 ∂ f 2 ( x ) \partial f(x)=a_1\partial f_1(x)+a_2\partial f_2(x) f(x)=a1f1(x)+a2f2(x)
  3. 线性变量替换: h h h为适当凸函数,且函数 f f f满足 f ( x ) = h ( A x + b ) , ∀ x ∈ R m f(x)=h(Ax+b),\forall x\in \R^m f(x)=h(Ax+b),xRm,其中 A ∈ R n × m , b ∈ R n A\in \R^{n×m},b\in R^n ARn×m,bRn。若存在 x # ∈ R m x^{\#}\in \R^m x#Rm,使得 A x # + b ∈ i n t d o m h Ax^{\#}+b\in int domh Ax#+bintdomh,则 ∂ f ( x ) = A T ∂ h ( A x + b ) , ∀ x ∈ i n t d o m f \partial f(x)=A^T\partial h(Ax+b),\forall x\in int dom f f(x)=ATh(Ax+b),xintdomf
    待补…
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值