1 概念
如果我们想知道某个随机变量XXX的分布FFF,这在一般情况下当然是无法准确知道的,但如果我们手上有它的一些独立同分布的样本,可不可以利用这些样本?一个很简单的办法就是,把这些样本的“频率”近似为随机变量的“概率”。
经验分布函数(empirical distribution function):给每个点1/n1/n1/n的概率质量,得到CDF:
F^n(x)=∑i=1nI(Xi≤x)n \hat{F}_n(x) = \dfrac{\sum_{i=1}^{n}I(X_i\leq x)}{n} F^n(x)=n∑i=1nI(Xi≤x)
2 性质
经验分布函数,有什么性质?它可以很好地近似真实的分布函数吗?我们给出如下几个定理。
定理:对于任意给定的xxx,有
- E(F^n(x))=F(x)E(\hat{F}_n(x) )=F(x)E(F^n(x))=F(x);
- V(F^n(x))=F(x)(1−F(x))n→0V(\hat{F}_n(x) )=\dfrac{F(x)(1-F(x))}{n}\to 0V(F^n(x))=nF(x)(1−F(x))→