CDF是累积分布函数(Cumulative Distribution Function)的缩写,它是概率论和统计学中一个重要的概念。CDF表示一个随机变量小于或等于某个特定值的概率。
定义
对于一个随机变量 XXX,其CDF F(x)F(x)F(x) 定义为:
F(x)=P(X≤x)F(x) = P(X \leq x)F(x)=P(X≤x)
其中,
- F(x)F(x)F(x) 是随机变量 XXX 的CDF。
- P(X≤x)P(X \leq x)P(X≤x) 表示随机变量 XXX 取值小于或等于 xxx 的概率。
特点
- 非递减性:CDF总是随着 xxx 的增加而非递减,因为随着观察值界限的增加,包含的事件数量不会减少。
- 范围:CDF的值域在0到1之间,即 0≤F(x)≤10 \leq F(x) \leq 10≤F(x)≤1。
- 极限性质:随机变量 XXX 的CDF满足 limx→−∞F(x)=0\lim_{x \to -\infty} F(x) = 0limx→−∞F(x)=0 和 limx→∞F(x)=1\lim_{x \to \infty} F(x) = 1limx→∞F(x)=1。
应用
- 概率计算:CDF可以用来确定随机变量在特定区间内取值的概率。
- 描述分布特性:CDF提供了随机变量分布的完整信息,可以用来描述其统计特性,如中位数、四分位数等。
- 统计分析和建模:在统计分析和概率建模中,CDF是基本工具,用于推断、假设检验和预测。
例子
如果随机变量 XXX 服从标准正态分布,则其CDF F(x)F(x)F(x) 表示的是随机变量 XXX 取值小于或等于 xxx 的概率,可以通过正态分布的积分来获得。对于标准正态分布,这个函数是S形的,其在 x=0x=0x=0 处的值约为0.5,这意味着随机变量小于0的概率为50%。