指数分布族的相关性质证明
有些东西,不自己推一遍还真的很难说自己掌握了。
指数分布族的一般形式
指数族分布满足以下一般形式,其中
a
(
ϕ
)
,
b
(
θ
)
,
c
(
x
,
ϕ
)
a(\phi),b(\theta),c(x,\phi)
a(ϕ),b(θ),c(x,ϕ) 为函数,随分布函数的不同而异:
f
(
x
;
θ
,
ϕ
)
=
exp
[
x
θ
−
b
(
θ
)
a
(
ϕ
)
+
c
(
x
,
ϕ
)
]
f\left(x ; \theta, \phi\right)=\exp \left[\frac{x \theta-b\left(\theta\right)}{a(\phi)}+c\left(x, \phi\right)\right]
f(x;θ,ϕ)=exp[a(ϕ)xθ−b(θ)+c(x,ϕ)]
引论:Moment Function
矩母函数定义如下:
M
X
(
t
)
=
E
(
e
t
X
)
M_X(t)=\mathbb{E}\left(e^{tX}\right)
MX(t)=E(etX)
如果对其进行求导的话,我们能够得到:(其中第二个等式是由于期望的线性性得到的)
∂
M
X
(
t
)
∂
t
=
∂
∂
t
E
(
e
t
X
)
=
E
(
∂
exp
(
t
X
)
∂
t
)
=
E
(
X
e
t
X
)
\frac{\partial M_X(t)}{\partial t}=\frac{\partial}{\partial t} \mathbb{E}\left(e^{tX}\right)= \mathbb{E}\left(\frac{\partial \exp(tX)}{\partial t}\right)=\mathbb{E}\left(Xe^{tX}\right)
∂t∂MX(t)=∂t∂E(etX)=E(∂t∂exp(tX))=E(XetX)
同样的结论可以推广到
n
n
n 阶导,因此可以求出这个分布的所有
n
n
n 阶矩:
∂
(
n
)
M
X
(
t
)
∂
t
(
n
)
=
E
(
X
n
e
t
X
)
\frac{\partial^{(n)} M_X(t)}{\partial t^{(n)}}=\mathbb{E}\left(X^{n}e^{tX}\right)
∂t(n)∂(n)MX(t)=E(XnetX)
指数分布族的矩母函数
根据定义:
M
X
(
t
)
=
E
(
e
t
X
)
=
∫
−
∞
+
∞
exp
[
x
θ
−
b
(
θ
)
a
(
ϕ
)
+
c
(
x
,
ϕ
)
]
×
exp
(
t
x
)
d
x
M_X(t)=\mathbb{E}\left(e^{tX}\right)=\int_{-\infty}^{+\infty}\exp \left[\frac{x \theta-b\left(\theta\right)}{a(\phi)}+c\left(x, \phi\right)\right]\times \exp(tx)dx
MX(t)=E(etX)=∫−∞+∞exp[a(ϕ)xθ−b(θ)+c(x,ϕ)]×exp(tx)dx
合并指数部分:
M
X
(
t
)
=
∫
−
∞
+
∞
exp
[
(
θ
+
a
(
ϕ
)
t
)
x
−
b
(
θ
)
a
(
ϕ
)
+
c
(
x
,
ϕ
)
]
d
x
M_X(t)=\int_{-\infty}^{+\infty}\exp \left[\frac{\left(\theta+a\left(\phi\right)t\right)x-b\left(\theta\right)}{a(\phi)}+c\left(x, \phi\right)\right]dx
MX(t)=∫−∞+∞exp[a(ϕ)(θ+a(ϕ)t)x−b(θ)+c(x,ϕ)]dx
因为只要满足指数族分布的一般形式,这个函数就是一个
p
d
f
pdf
pdf ,因此在这里,我们的目标在于将这个积分化为指数分布族形式,这里令
θ
~
=
θ
+
a
(
ϕ
)
t
\tilde \theta=\theta+a\left(\phi\right)t
θ~=θ+a(ϕ)t 。(注意:这里是不影响对
x
x
x 的积分的)
M
X
(
t
)
=
∫
−
∞
+
∞
exp
[
θ
~
x
−
(
b
(
θ
~
)
−
b
(
θ
~
)
)
−
b
(
θ
)
a
(
ϕ
)
+
c
(
x
,
ϕ
)
]
d
x
=
∫
−
∞
+
∞
exp
[
b
(
θ
~
)
−
b
(
θ
)
a
(
ϕ
)
]
×
exp
[
θ
~
x
−
b
(
θ
~
)
a
(
ϕ
)
+
c
(
x
,
ϕ
)
]
d
x
\begin{aligned}M_X(t)&=\int_{-\infty}^{+\infty}\exp \left[\frac{\tilde \theta x-\left(b(\tilde\theta)-b(\tilde \theta)\right)-b\left(\theta\right)}{a(\phi)}+c\left(x, \phi\right)\right]dx\\&=\int_{-\infty}^{+\infty}\exp\left[\frac{b(\tilde \theta)-b\left(\theta\right)}{a(\phi)}\right]\times\exp \left[\frac{\tilde \theta x-b(\tilde\theta)}{a(\phi)}+c\left(x, \phi\right)\right]dx\end{aligned}
MX(t)=∫−∞+∞exp⎣⎡a(ϕ)θ~x−(b(θ~)−b(θ~))−b(θ)+c(x,ϕ)⎦⎤dx=∫−∞+∞exp[a(ϕ)b(θ~)−b(θ)]×exp[a(ϕ)θ~x−b(θ~)+c(x,ϕ)]dx
将前面一项不影响积分的乘出来,然后积分符号里剩下的就是一个指数分布族的
p
d
f
pdf
pdf :
f
(
x
,
θ
~
,
ϕ
)
f(x,\tilde \theta, \phi)
f(x,θ~,ϕ) 。
M
X
(
t
)
=
exp
[
b
(
θ
~
)
−
b
(
θ
)
a
(
ϕ
)
]
×
∫
−
∞
+
∞
f
(
x
,
θ
~
,
ϕ
)
d
x
=
exp
[
b
(
θ
~
)
−
b
(
θ
)
a
(
ϕ
)
]
\begin{aligned}M_X(t)&=\exp\left[\frac{b(\tilde \theta)-b\left(\theta\right)}{a(\phi)}\right]\times\int_{-\infty}^{+\infty} f(x,\tilde \theta,\phi)dx\\&=\exp\left[\frac{b(\tilde \theta)-b\left(\theta\right)}{a(\phi)}\right]\end{aligned}
MX(t)=exp[a(ϕ)b(θ~)−b(θ)]×∫−∞+∞f(x,θ~,ϕ)dx=exp[a(ϕ)b(θ~)−b(θ)]
指数分布族相关统计量(期望、方差)
Expectation
根据之前提到的矩母函数的相关性质,可以通过链式法则求导求取其均值:
E
(
X
)
=
∂
M
X
(
t
)
∂
t
∣
t
=
0
=
a
(
ϕ
)
×
b
′
(
θ
+
a
(
ϕ
)
t
)
a
(
ϕ
)
×
exp
[
b
(
θ
+
a
(
ϕ
)
t
)
−
b
(
θ
)
a
(
ϕ
)
]
∣
t
=
0
=
b
′
(
θ
)
\begin{aligned}\mathbb{E}\left(X\right)&=\frac{\partial M_X(t)}{\partial t}\Bigg|_{t=0}=\frac{a(\phi)\times b'(\theta+a\left(\phi\right)t)}{a(\phi)}\times\exp\left[\frac{b(\theta+a\left(\phi\right)t)-b\left(\theta\right)}{a(\phi)}\right]\Bigg|_{t=0}\\&=b'(\theta)\end{aligned}
E(X)=∂t∂MX(t)∣∣∣∣∣t=0=a(ϕ)a(ϕ)×b′(θ+a(ϕ)t)×exp[a(ϕ)b(θ+a(ϕ)t)−b(θ)]∣∣∣∣∣t=0=b′(θ)
对期望来说,我们能够得到一个一般形式。即:对所有满足指数分布族形式的
p
d
f
pdf
pdf 的随机变量而言,都有:
E
(
X
)
=
b
′
(
θ
)
\mathbb{E}\left(X\right)=b'(\theta)
E(X)=b′(θ)
Variance
要求取方差,我们需要这个分布的二阶矩(我这里直接顺着期望求得的一阶导往下求):
E
(
X
2
)
=
M
X
′
′
(
t
)
∣
t
=
0
=
{
b
′
(
θ
+
a
(
ϕ
)
t
)
×
exp
[
b
(
θ
+
a
(
ϕ
)
t
)
−
b
(
θ
)
a
(
ϕ
)
]
}
′
∣
t
=
0
=
a
(
ϕ
)
×
b
′
′
(
θ
+
a
(
ϕ
)
t
)
×
exp
[
b
(
θ
+
a
(
ϕ
)
t
)
−
b
(
θ
)
a
(
ϕ
)
]
∣
t
=
0
+
(
b
′
(
θ
+
a
(
ϕ
)
t
)
)
2
×
exp
[
b
(
θ
+
a
(
ϕ
)
t
)
−
b
(
θ
)
a
(
ϕ
)
]
∣
t
=
0
=
a
(
ϕ
)
×
b
′
′
(
θ
)
+
b
′
(
θ
)
2
=
a
(
ϕ
)
×
b
′
′
(
θ
)
+
E
(
X
)
2
\begin{aligned}\mathbb{E}\left(X^2\right)&=M_X''(t)\Big|_{t=0}\\=&\left\{b'(\theta+a\left(\phi\right)t)\times\exp\left[\frac{b(\theta+a\left(\phi\right)t)-b\left(\theta\right)}{a(\phi)}\right]\right\}'\Bigg|_{t=0}\\=&a(\phi)\times b''(\theta+a(\phi)t)\times\exp\left[\frac{b(\theta+a\left(\phi\right)t)-b\left(\theta\right)}{a(\phi)}\right]\Bigg|_{t=0}\\&+\left(b'(\theta+a\left(\phi\right)t)\right)^2\times\exp\left[\frac{b(\theta+a\left(\phi\right)t)-b\left(\theta\right)}{a(\phi)}\right]\Bigg|_{t=0}\\=&a(\phi)\times b''(\theta)+b'(\theta)^2\\=&a(\phi)\times b''(\theta)+\mathbb{E}\left(X\right)^2\end{aligned}
E(X2)=====MX′′(t)∣∣∣t=0{b′(θ+a(ϕ)t)×exp[a(ϕ)b(θ+a(ϕ)t)−b(θ)]}′∣∣∣∣∣t=0a(ϕ)×b′′(θ+a(ϕ)t)×exp[a(ϕ)b(θ+a(ϕ)t)−b(θ)]∣∣∣∣∣t=0+(b′(θ+a(ϕ)t))2×exp[a(ϕ)b(θ+a(ϕ)t)−b(θ)]∣∣∣∣∣t=0a(ϕ)×b′′(θ)+b′(θ)2a(ϕ)×b′′(θ)+E(X)2
因此对所有
p
d
f
pdf
pdf 满足指数分布族形式的随机变量的期望为:
V
a
r
(
X
)
=
E
(
X
2
)
−
E
(
X
)
2
=
a
(
ϕ
)
×
b
′
′
(
θ
)
\mathbb{Var}\left(X\right)=\mathbb{E}\left(X^2\right)-\mathbb{E}\left(X\right)^2=a(\phi)\times b''(\theta)
Var(X)=E(X2)−E(X)2=a(ϕ)×b′′(θ)