凸集的定义:
设集合D⊂RnD⊂Rn,若对于任意点x,y∈Dx,y∈D及实数α∈[0,1]α∈[0,1],都有αx+(1−α)y∈Dαx+(1−α)y∈D
则称集合DD为凸集。
由凸集的定义可以看出凸集的几何意义,对于非空集合
,连接DD中任意两点
的线段仍属于该集合,则该集合DD是凸集。
图1所示的图形是凸集,图2显示的图形是非凸集。
凸函数定义:
设函数 定义在凸集D⊂RnD⊂Rn上,若对于任意的x,y∈Dx,y∈D及任意实数α∈[0,1]α∈[0,1],都有f[αx+(1−α)y]≤αf(x)+(1−α)f(y)f[αx+(1−α)y]≤αf(x)+(1−α)f(y),则称f(x)f(x)为凸集DD上的凸函数。
凸函数的充分必要条件:
(一阶条件)
设在凸集
上f(x)f(x)可微,则f(x)f(x)在DD上为凸函数的充分必要条件是对任意的
都有f(y)≥f(x)+∇f(x)T(y−x)f(y)≥f(x)+∇f(x)T(y−x)
证明:
必要性。 设f(x)f(x)是DD上的凸函数。任取
及α∈[0,1]α∈[0,1],有
即
由泰勒公式有
代入上式得
上式两端取极限,令α→0α→0有