P12 二阶条件2

二阶条件

仿射函数: f ( x ) = A x + b ▽ 2 f ( x ) = 0 f(x)=Ax+b\quad\triangledown^2f(x)=0 f(x)=Ax+b2f(x)=0

指数函数: f ( x ) = e a x , x ∈ R f(x)=e^{ax},x\in R\quad f(x)=eax,xR
f ′ ( x ) = a e a x f'(x)=ae^{ax} f(x)=aeax
f ′ ′ ( x ) = a 2 e a x f''(x)=a^2e^{ax} f(x)=a2eax
恒大于0,所以指数函数是凸函数。

幂函数 f ( x ) = x a , x ∈ R + + f(x)=x^a,x \in R_{++} f(x)=xa,xR++
f ′ ( x ) = a x a − 1 f'(x)=ax^{a-1} f(x)=axa1
f ′ ′ ( x ) = a ( a − 1 ) x a − 2 f''(x)=a(a-1)x^{a-2} f(x)=a(a1)xa2
▽ 2 f ( n ) = { ≥ 0 , if  a ≥ 0 或 a ≤ 0 ≤ 0 , if  0 ≤ a ≤ 1 \triangledown^2 f(n)= \begin{cases} \geq 0, & \text {if $a \geq 0$或$a \leq 0$} \\ \leq 0, & \text{if $0 \leq a \leq 1$} \end{cases} 2f(n)={0,0,if a0a0if 0a1
a = 1 a=1 a=1为仿射函数,即是凸的也是凹的,
a = 0 a=0 a=0为常数

绝对值的幂函数 f ( x ) = ∣ x ∣ p , x ∈ R f(x)=|x|^p,x \in R f(x)=xp,xR
f ′ ( x ) = { p x p − 1 if  x ≥ 0 − p ( − x ) p − 1 if  x < 0 f'(x)= \begin{cases} p x ^{p-1} & \text {if $x \geq 0$} \\ -p(-x)^{p-1} & \text {if $x <0$} \end{cases} f(x)={pxp1p(x)p1if x0if x<0
f ′ ′ ( x ) = { p ( p − 1 ) x p − 2 if  x ≥ 0 p ( p − 1 ) ( − x ) p − 2 if  x < 0 f''(x)= \begin{cases} p(p-1) x ^{p-2} & \text {if $x \geq 0$} \\ p(p-1)(- x) ^{p-2} & \text {if $x <0$} \end{cases} f(x)={p(p1)xp2p(p1)(x)p2if x0if x<0
p = 1 p=1 p=1, f ( x ) f(x) f(x)不可导。不用用二阶条件判断。
然而:
在这里插入图片描述
通过凸函数的性质,我们得知当 1 ≤ p < 2 1 \leq p < 2 1p<2, f ( x ) f(x) f(x)为凸函数。
p ≥ 2 p \geq 2 p2时,通过二阶条件可得为凸函数。
所以:当 p ≥ 1 p \geq 1 p1, f ( x ) f(x) f(x)为凸函数。

对数函数: f ( x ) = l o g ( x ) , x ∈ R + + f(x)=log(x),x\in R_{++} f(x)=log(x),xR++
f ′ ( x ) = 1 x f'(x)=\frac{1}{x} f(x)=x1
f ′ ′ ( x ) = − 1 x 2 f''(x)=-\frac{1}{x^2} f(x)=x21
对数函数是凹函数.

负熵: f ( x ) = x l o g ( x ) , x ∈ R + + f(x)=xlog(x),x\in R_{++} f(x)=xlog(x),xR++
f ′ ( x ) = l o g x + 1 f'(x)=logx+1 f(x)=logx+1
f ′ ′ ( x ) = 1 x f''(x)=\frac{1}{x} f(x)=x1
所以负熵是凸函数。

范数
R n R^n Rn空间的范数 p ( x ) x ∈ R n p(x)\quad x\in R^n p(x)xRn
范数函数判断满足三个性质
1. p ( a x ) = ∣ a ∣ p ( x ) p(ax)=|a|p(x) p(ax)=ap(x)
2. p ( x + y ) ≤ p ( x ) + p ( y ) p(x+y)\leq p(x)+p(y) p(x+y)p(x)+p(y)
3. p ( x ) = 0 ⇔ x = 0 p(x)=0 \Leftrightarrow x=0 p(x)=0x=0

∀ x , y ∈ R n ∀ 0 ≤ θ ≤ 1 \forall x,y \in R^n \quad \forall 0 \leq \theta \leq 1 x,yRn0θ1
p ( θ x + ( 1 − θ ) y ) ≤ p ( θ x ) + p ( ( 1 − θ ) y ) = θ p ( x ) + ( 1 − θ ) p ( y ) p(\theta x + (1-\theta)y) \leq p(\theta x)+ p((1-\theta)y) = \theta p(x) + (1-\theta)p(y) p(θx+(1θ)y)p(θx)+p((1θ)y)=θp(x)+(1θ)p(y)
所以:范数是凸函数

零范数
∣ ∣ x ∣ ∣ 0 ||x||_0 x0 非零元素数目
零范数不是范数也不是凸函数。
x ∈ R x \in R xR
在这里插入图片描述
不满足范数定义的第一条性质:
在这里插入图片描述

极大值函数: f ( x ) = m a x { x 1 , . . . x n } x ∈ R n f(x)=max \lbrace x_1,...x_n \rbrace \quad x \in R^n f(x)=max{x1,...xn}xRn
∀ x , y ∈ R n ∀ 0 ≤ θ ≤ 1 \forall x,y \in R^n \quad \forall 0 \leq \theta \leq 1 x,yRn0θ1
p ( θ x + ( 1 − θ ) y ) = m a x { θ x i + ( 1 − θ ) y i , i = 1 , . . . n } ≤ θ m a x { x i , i = 1 , . . . n } + ( 1 − θ ) m a x { x i , i = 1 , . . . n } = θ f ( x ) + ( 1 − θ ) f ( y ) \begin{aligned} p(\theta x + (1-\theta)y) &= max \lbrace \theta x_i + (1-\theta)y_i,i=1,...n \rbrace \\ &\leq\theta max \lbrace x_i ,i=1,...n \rbrace + (1- \theta) max \lbrace x_i ,i=1,...n \rbrace \\ &=\theta f(x) + (1-\theta) f(y) \end{aligned} p(θx+(1θ)y)=max{θxi+(1θ)yi,i=1,...n}θmax{xi,i=1,...n}+(1θ)max{xi,i=1,...n}=θf(x)+(1θ)f(y)
所以:极大值函数是凸函数。

解析逼近:对不可导的函数做可导的逼近。
极大值函数的解析逼近:
log-sum-up:
f ( x ) = l o g ( e x 1 + . . . + e x n ) x ∈ R n f(x)=log(e^{x_1}+...+e^{x_n}) \quad x \in R^n f(x)=log(ex1+...+exn)xRn

m a x { x 1 . . . x n } ≤ f ( x ) ≤ m a x { x 1 . . . x n } + log ⁡ n max \lbrace x_1...x_n \rbrace \leq f(x) \leq max \lbrace x_1...x_n \rbrace + \log n max{x1...xn}f(x)max{x1...xn}+logn

∂ f ∂ x i = e x i e x 1 + . . . + e x n \frac{\partial f}{\partial x_i} = \frac{e^{x_i}}{e^{x_1}+...+e^{x_n}} xif=ex1+...+exnexi
在这里插入图片描述

i ≠ j i \not= j i=j
∂ 2 f ∂ x i ∂ x j = − e x i e x j ( e x 1 + . . . + e x n ) 2 \frac{\partial^2 f}{\partial x_i \partial x_j} = \frac{- e^{x_i}e^{x_j}}{(e^{x_1}+...+e^{x_n})^2} xixj2f=(ex1+...+exn)2exiexj
i = j i = j i=j
∂ 2 f ∂ x i ∂ x i = − e x i e x i + e x i ( e x 1 + . . . + e x n ) ( e x 1 + . . . + e x n ) 2 \frac{\partial^2 f}{\partial x_i \partial x_i} = \frac{- e^{x_i}e^{x_i} + e^{x_i}(e^{x_1}+...+e^{x_n})}{(e^{x_1}+...+e^{x_n})^2} xixi2f=(ex1+...+exn)2exiexi+exi(ex1+...+exn)

在这里插入图片描述
定义: Z = [ e x 1 , . . . , e x n ] Z=[e^{x_1},...,e^{x_n}] Z=[ex1,...,exn]

H = 1 ( 1 T ⋅ Z ) 2 ( ( 1 T Z ) d i a g { Z } − Z Z T ) H=\frac{1}{(1^T \cdot Z)^2}((1^TZ)diag\lbrace Z \rbrace - ZZ^T) H=(1TZ)21((1TZ)diag{Z}ZZT)

定义: K = ( 1 T Z ) d i a g { Z } − Z Z T K=(1^TZ)diag\lbrace Z \rbrace - ZZ^T K=(1TZ)diag{Z}ZZT

半正定举证判定: ∀ V ∈ R n V T K V ≥ 0 \forall V \in R^n \quad V^TKV \geq 0 VRnVTKV0

V T K V = ( 1 T Z ) V T d i a g { Z } V − V T Z Z T V = ( ∑ i Z i ) ( ∑ i V i 2 Z i ) − ( ∑ i V i Z i ) 2 V^TKV=(1^TZ) V^T diag\lbrace Z \rbrace V - V^T ZZ^T V =(\sum_i Z_i)(\sum_i V_i^2Z_i)-(\sum_i V_iZ_i)^2 VTKV=(1TZ)VTdiag{Z}VVTZZTV=(iZi)(iVi2Zi)(iViZi)2

定义: a i = V i Z i b i = Z i a_i=V_i \sqrt{Z_i} \quad b_i=\sqrt {Z_i} ai=ViZi bi=Zi

V T K V = ( b T b ) ( a T a ) − ( a T b ) 2 ≥ 0 V^TKV=(b^Tb)(a^Ta)-(a^Tb)^2 \geq 0 VTKV=(bTb)(aTa)(aTb)20 因为 Cachy-Schwartz 不等式

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值