Jensen不等式的形式有很多种,这里重点关注有关于随机变量期望的形式。
1 Jensen不等式
Jensen不等式:已知函数ϕ:R→R\phi: \mathbb{R}\to\mathbb{R}ϕ:R→R为凸函数,则有ϕ[E(X)]≤E[ϕ(X)]\phi[\text{E}(X)]\leq \text{E}[\phi(X)]ϕ[E(X)]≤E[ϕ(X)]。
有时候,需要用到离散形式的Jensen不等式:{aj}\{a_j\}{aj}是一系列非负权重,满足∑j=1maj=1\sum_{j=1}^m a_j=1∑j=1maj=1,{xj}\{x_j\}{xj}是一系列任意实数,对于凸函数ϕ:R→R\phi: \mathbb{R}\to\mathbb{R}ϕ:R→R,有
ϕ(∑j=1majxj)≤∑j=1majϕ(xj)
\phi\left(\sum_{j=1}^m a_j x_j\right) \leq \sum_{j=1}^m a_j \phi(x_j)
ϕ(j=1∑majxj)≤j=1∑majϕ(xj)
只需将原期望形式的Jensen不等式中的随机变量取成离散的,并令P(X=xj)=ajP(X=x_j)=a_jP(X=xj)=aj,即可得到上式。
2 条件Jensen不等式
将不等式两边的期望都取为条件期望的形式,不等式依然成立。
条件Jensen不等式:已知函数ϕ:R→R\phi: \mathbb{R}\to\mathbb{R}ϕ:R→R为凸函数,则有ϕ[E(X∣Y)]≤E[ϕ(X)∣Y]\phi[\text{E}(X|Y)]\leq \text{E}[\phi(X)|Y]ϕ[E(X∣Y)]≤E[ϕ(X)∣Y]。
来看一个应用:在Var(X)<∞\text{Var}(X)<\inftyVar(X)<∞的条件下,利用条件Jensen不等式,可以证明Var[E(X∣Y)]≤Var(X)\text{Var}[\text{E}(X|Y)]\leq \text{Var}(X)Var[E(X∣Y)]≤Var(X)。
证明如下:
[E(X∣Y)−E(X)]2=[E(X∣Y)]2+[E(X)]2−2E(X∣Y)E(X)≤E(X2∣Y)+[E(X)]2−2E(X∣Y)E(X)
\begin{aligned}
&[\text{E}(X|Y)-\text{E}(X)]^2 \\
=& [\text{E}(X|Y)]^2+[\text{E}(X)]^2 - 2\text{E}(X|Y)\text{E}(X)\\
\leq & \text{E}(X^2|Y)+[\text{E}(X)]^2 - 2\text{E}(X|Y)\text{E}(X)
\end{aligned}
=≤[E(X∣Y)−E(X)]2[E(X∣Y)]2+[E(X)]2−2E(X∣Y)E(X)E(X2∣Y)+[E(X)]2−2E(X∣Y)E(X)
两边取期望后,可得
E{{E(X∣Y)−E[E(X∣Y)]}2}(=Var[E(X∣Y)])≤E[E(X2∣Y)]+[E(X)]2−2[E(X)]2=E(X2)+[E(X)]2−2[E(X)]2=Var(X)
\begin{aligned}
&\text{E}\left\{\left\{\text{E}(X|Y)-\text{E}[\text{E}(X|Y)]\right\}^2\right\} \\
(= & \text{Var}[\text{E}(X|Y)])\\
\leq & \text{E}[\text{E}(X^2|Y)]+[\text{E}(X)]^2 - 2[\text{E}(X)]^2\\
= & \text{E}(X^2)+[\text{E}(X)]^2 - 2[\text{E}(X)]^2\\
= & \text{Var}(X)
\end{aligned}
(=≤==E{{E(X∣Y)−E[E(X∣Y)]}2}Var[E(X∣Y)])E[E(X2∣Y)]+[E(X)]2−2[E(X)]2E(X2)+[E(X)]2−2[E(X)]2Var(X)
得证。
3 Jensen不等式的应用
许许多多不等式,都可以利用Jensen不等式得出,这里整理一些例子。
3.1 套用简单函数
将ϕ\phiϕ直接取为简单的凸函数或凹函数,就可以得到许多不等式:
- [E(X)]2≥E(X2)[\text{E}(X)]^2 \geq \text{E}(X^2)[E(X)]2≥E(X2)
- ∣E(X)∣≤E∣X∣|\text{E}(X)|\leq \text{E}|X|∣E(X)∣≤E∣X∣;
- exp[E(X)]≤E[exp(X)]\exp[\text{E}(X)]\leq \text{E}[\exp(X)]exp[E(X)]≤E[exp(X)];
- E[log(X)]≤log[E(X)]\text{E}[\log(X)]\leq \log[\text{E}(X)]E[log(X)]≤log[E(X)];
- E[X1/2]≤[E(X)]1/2\text{E}[X^{1/2}]\leq [\text{E}(X)]^{1/2}E[X1/2]≤[E(X)]1/2。
3.2 Lyapunov不等式
Lyapunov不等式:对于任意0≤p≤q0\leq p \leq q0≤p≤q,有
[E(∣X∣p)]1/p≤[E(∣X∣q)]1/q
[\text{E}(|X|^{p})]^{1/p} \leq [\text{E}(|X|^{q})]^{1/q}
[E(∣X∣p)]1/p≤[E(∣X∣q)]1/q
证明过程,只需利用凸函数ϕ(x)=xq/p\phi(x)=x^{q/p}ϕ(x)=xq/p,和随机变量Y=∣X∣qY=|X|^qY=∣X∣q即可。
3.3 几何均值不等式
几何均值不等式(Geometric Mean Inequality):{aj∣\{a_j|{aj∣是一系列非负权重,满足∑j=1maj=1\sum_{j=1}^m a_j=1∑j=1maj=1,{xj}\{x_j\}{xj}是一系列任意的非负实数,则有
x1a1x2a2⋯xmam≤∑j=1majxj
x_1^{a_1}x_2^{a_2}\cdots x_m^{a_m}\leq \sum_{j=1}^m a_j x_j
x1a1x2a2⋯xmam≤j=1∑majxj
证明要用到离散形式的Jensen不等式,将ϕ\phiϕ取为对数函数即可,由于对数函数是凹函数,不等式需反向。
如果取m=2m=2m=2,a1=a2=12a_1=a_2=\dfrac{1}{2}a1=a2=21,就是在中学阶段熟悉的x1x2≤x1+x22\sqrt{x_1 x_2}\leq \dfrac{x_1+x_2}{2}x1x2≤2x1+x2,即几何均值小于等于代数均值。
3.4 Loeve’s CrC_rCr Inequality
对于一系列的任意实数xjx_jxj,有
∣∑j=1mxj∣r≤{∑j=1m∣xj∣r,0<r≤1mr−1∑j=1m∣xj∣r,r>1
\left| \sum_{j=1}^m x_j \right|^r \leq
\begin{cases}
\sum\limits_{j=1}^m |x_j|^r&,0\lt r\leq 1\\
m^{r-1} \sum\limits_{j=1}^m |x_j|^r&, r\gt 1
\end{cases}
∣∣∣∣∣j=1∑mxj∣∣∣∣∣r≤⎩⎪⎪⎨⎪⎪⎧j=1∑m∣xj∣rmr−1j=1∑m∣xj∣r,0<r≤1,r>1
当m=2m=2m=2时,记Cr=max{1,2r−1}C_r=\max\{1,2^{r-1}\}Cr=max{1,2r−1},该不等式可写为
∣a+b∣r≤Cr(∣a∣r+∣b∣r)
|a+b|^r\leq C_r \left(|a|^r+|b|^r\right)
∣a+b∣r≤Cr(∣a∣r+∣b∣r)
因此也叫CrC_rCr不等式。
证明同样需用到离散形式Jensen不等式。若r>1r\gt 1r>1,取aj=1/ma_j=1/maj=1/m,ϕ(x)=∣x∣r\phi(x)=|x|^rϕ(x)=∣x∣r,即可得证。若r≤1r\leq 1r≤1,记∑j=1m∣xj∣=A\sum_{j=1}^m |x_j|=A∑j=1m∣xj∣=A,取bj=∣xj∣/Ab_j=|x_j|/Abj=∣xj∣/A,则bj∈[0,1]b_j\in [0,1]bj∈[0,1],因此有bj≤bjrb_j\leq b_j^rbj≤bjr,因此
1=∑j=1mbj≤∑j=1mbjr=∑j=1m∣xj∣rAr
1=\sum_{j=1}^m b_j\leq \sum_{j=1}^m b_j^r=\dfrac{\sum_{j=1}^m |x_j|^r}{A^r}
1=j=1∑mbj≤j=1∑mbjr=Ar∑j=1m∣xj∣r
再利用∣∑j=1mxj∣≤∑j=1m∣xj∣=A|\sum_{j=1}^m x_j |\leq \sum_{j=1}^m |x_j|=A∣∑j=1mxj∣≤∑j=1m∣xj∣=A,即可得证。
3.5 范数不等式
范数不等式:对于0<p≤q0\lt p\leq q0<p≤q,有
∣∑j=1m∣xj∣q∣1/q≤∣∑j=1m∣xj∣p∣1/p
\left| \sum_{j=1}^m |x_j|^q \right|^{1/q} \leq\left| \sum_{j=1}^m |x_j|^p \right|^{1/p}
∣∣∣∣∣j=1∑m∣xj∣q∣∣∣∣∣1/q≤∣∣∣∣∣j=1∑m∣xj∣p∣∣∣∣∣1/p
取r=p/q≤1r=p/q\leq 1r=p/q≤1,yj=∣xj∣qy_j=|x_j|^qyj=∣xj∣q,利用上一节中的CrC_rCr不等式,可得
∣∑j=1myj∣r≤∑j=1m∣yj∣r
\left| \sum_{j=1}^m y_j \right|^r \leq \sum_{j=1}^m |y_j|^r
∣∣∣∣∣j=1∑myj∣∣∣∣∣r≤j=1∑m∣yj∣r
将xjx_jxj代回并两边取1/p1/p1/p次方即可得证。
本文详细介绍了Jensen不等式及其条件形式,包括离散形式的应用,并通过多个例子展示了Jensen不等式在证明不等式、几何均值、Lyapunov不等式、Loeve's Cr不等式以及范数不等式中的应用。
4234

被折叠的 条评论
为什么被折叠?



