1. 凸函数的定义
1.1 凸函数的几何解释
所谓凸函数,其实指的是下凸函数,从几何意义上看,凸函数就是任意两点之间的弦(即这两点构成的线段)都在该函数图像(此处是指这两点之间的函数图像,而非全部的函数图像)的上方。
1.2 凸函数的数学解释
如果≤\le≤换成<<<,则是严格凸函数的数学定义。
Q:凸集的定义是什么?
凸集的几何解释:如果集合C中任意2个点X1,X2X_1,X_2X1,X2,其连线上的所有点都是集合C中的点,则C为凸集。
凸集的数学解释:对任何X1∈C,X2∈CX_1\in C,X_2 \in CX1∈C,X2∈C,有aX1+(1−a)X2∈C(0<a<1)aX_1+(1-a)X_2\in C(0<a<1)aX1+(1−a)X2∈C(0<a<1),则称C是凸集。
Q:为什么要求定义域是凸集?
只有定义域是凸集时,θx+(1−θ)y\theta x+(1-\theta)yθx+(1−θ)y才属于定义域,f(θx+(1−θ)y)f(\theta x+(1-\theta)y)f(θx+(1−θ)y)才有意义。
2. 凸函数的一阶特征
2.1 一阶特征的几何解释
在凸函数任何点画一条切线,在这条线上的每个点都将小于在函数f上的点,
2.2 一阶特征的数学解释
3. 凸函数的二阶特征
3.1 二阶特征的几何解释
在点x处函数图像具有正(向上)的曲率