正态分布的奥秘:理论、应用与实践
1. 正态分布简介
正态分布在统计学中占据着至关重要的地位。许多自然和社会现象都可以用正态分布来建模。即便某些测量数据不能直接用正态分布描述(如偏态、离散或多峰数据),在非常宽松的条件下,它们的样本均值也会近似服从正态分布。这一特性使得正态分布在统计学中无处不在,许多估计量、检验统计量和非参数检验在样本量较大(通常大于 20 到 30)时都近似服从正态分布。
1.1 正态分布的起源
1738 年,亚伯拉罕·棣莫弗(Abraham de Moivre)将正态分布作为二项分布的近似提出,随后拉普拉斯(Laplace)在 1783 年用它来研究测量误差,高斯(Gauss)在 1809 年将其用于天文数据分析。“正态”这个名称来自凯特勒(Quetelet),他通过研究发现许多人类特征,如 5738 名苏格兰士兵的胸围、100000 名法国新兵的身高以及人们的体重和身高,都呈现出钟形分布。基于他对身高和体重的研究,还衍生出了国际公认的肥胖测量指标——凯特勒指数(QI),即身体质量指数(BMI),计算公式为 QI =(体重(千克))/(身高(米)的平方)。
1.2 正态分布的概率密度函数(PDF)
正态随机变量的概率密度函数为:
[f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{1}{2\sigma^2}(x - \mu)^2}, -\infty < x < \infty]
其中,(\mu) 是均值,(\sigma^2) 是方差。随机变量 (X) 服从正态分布可表示为 (X \sim N(\mu, \sigma^2))。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



