概率统计总结

最新推荐文章于 2025-08-15 09:01:03 发布

原创

最新推荐文章于 2025-08-15 09:01:03 发布 · 2.6k 阅读

21 ·

CC 4.0 BY-SA版权

文章标签：

#概率论

本文详细介绍了概率统计的核心概念，包括随机事件、随机变量、数理统计、描述性统计和常见分布。重点讲解了条件概率、数学期望、方差、偏度与峰度以及假设检验的基本步骤和统计量选择。通过实例解析了二项分布、泊松分布、正态分布等常见概率分布，并探讨了参数估计和方差分析的思想。

一、随机事件

概念

现实生活中，一个动作或一个事情，在一定条件下，所得到的结果是不能预先完全确定的，而只能确定是多种可能结果中的一种，称这种现象为随机事件。我们用 $X$ 表示，用 $p(X=x_i)$ 表示这个事件出现结果为 $x_i$ 的概率（信念的度量），其中 $x_i$ 为随机变量 $X$ 出现的若干个结果中的第 $i$ 个。

条件概率

研究随机事件之间关系时，在已知某些事件 $X$ 的条件下考虑另一些事件 $Y$ 发生的概率是经常遇到的,即为条件概率 $p (Y ∣ X)$ 。
$P(Y=yi∣X=xi)=P(XxiYyi)P(Xxi)P(Y=y_i|X=x_i) = \frac {P(X_{x_i}Y_{y_i})} {P(X_{x_i})}$

二、随机变量

随机变量及其分布

描述随机变量时不仅要说明它能够取哪些值，而且还要关心它取这些值的概率，即为随机变量的分布，分为离散型随机变量和连续性随机变量。

$P \{ X =x_k \} =p_k,k=1,2,...$
$\{ X<=x\} ,x \in (- \infty ,+ \infty)$

随机变量的特征

数学期望

离散型：
$\sum_{i} {x_ip_i}$
连续型
$\int_{- \infty}^{+ \infty}{xf（x）}dx$

方差

离散型
$D（X） =E\{ [X-E(X)]^2\}$
连续型
$=\int_{- \infty}^{+ \infty}{(x-E(X))^2f（x）}dx$

协方差

$Cov(X, Y) = E\{ [X-E(X)] [Y-E(Y)]\}$

上面的公式适合离散型和连续型

三、数理统计

概念

在数理统计中，称研究对象的全体为总体，通常用一个随机变量表示总体。组成总体的每个基本单元叫个体。从总体 $X$ 中随机抽取一部分个体 $X_1,X_2,...,X_n$ ,称 $X_1,X_2,...,X_n$ 为取自 $X$ 的容量为 $n$ 的样本（这里的 $X_1$ 是表示第一次随机试验它的取值有 $i$ 个用 $x_i$ 表示对应的结果，即为观测值）

统计量与抽样

数理统计的任务是采集和处理带有随机影响的数据，或者说收集样本并对之进行加工，对样本的研究推断总体（对总体得出一定的结论），这一过程称为为统计推断。在统计推断中，对样本进行加工整理，实际上就是根据样本计算出一些量，使得这些量能够将所研究问题的信息集中起来。这种根据样本计算出的量就是下面将要定义的统计量，因此，统计量是样本的某种函数

常用的统计量

1. 样本均值

设 $X_1,X_2,...,X_n$ 是总体 $X$ 的一个简单随机样本，称
$\overline X = \frac{1} {n} {\sum_{i=1}^{n}X_i}$
为样本均值。通常用样本均值来估计总体分布的均值和对有关总体分布均值的假设作检验。

2. 样本方差

设 $X_1,X_2,...,X_n$ 是总体 $X$ 的一个简单随机样本， $X‾\overline X$ 为样本均值，称
$S^2 = \frac{1} {n-1} {\sum_{i=1}^{n}(X_i-\overline X)^2}$
为样本方差。通常用样本方差来估计总体分布的方差和对有关总体分布均值或方差的假设作检验。