一、随机事件
概念
现实生活中,一个动作或一个事情,在一定条件下,所得到的结果是不能预先完全确定的,而只能确定是多种可能结果中的一种,称这种现象为随机事件。我们用XXX表示,用p(X=xi)p(X=x_i)p(X=xi)表示这个事件出现结果为xix_ixi的概率(信念的度量),其中xix_ixi为随机变量XXX出现的若干个结果中的第iii个。
条件概率
研究随机事件之间关系时,在已知某些事件XXX的条件下考虑另一些事件YYY发生的概率是经常遇到的,即为条件概率p(Y∣X)p(Y|X)p(Y∣X)。
P(Y=yi∣X=xi)=P(XxiYyi)P(Xxi)P(Y=y_i|X=x_i) = \frac {P(X_{x_i}Y_{y_i})} {P(X_{x_i})} P(Y=yi∣X=xi)=P(Xxi)P(XxiYyi)
二、随机变量
随机变量及其分布
描述随机变量时不仅要说明它能够取哪些值,而且还要关心它取这些值的概率,即为随机变量的分布,分为离散型随机变量和连续性随机变量。
P{
X=xk}=pk,k=1,2,... P \{ X =x_k \} =p_k,k=1,2,... P{
X=xk}=pk,k=1,2,...
F(x)=P{
X<=x},x∈(−∞,+∞) F(x) = P \{ X<=x\} ,x \in (- \infty ,+ \infty) F(x)=P{
X<=x},x∈(−∞,+∞)
随机变量的特征
数学期望
- 离散型:
E(X)=∑ixipi E(X) = \sum_{i} {x_ip_i} E(X)=i∑xipi - 连续型
E(X)=∫−∞+∞xf(x)dx E(X)= \int_{- \infty}^{+ \infty}{xf(x)}dx E(X)=∫−∞+∞xf(x)dx
方差
- 离散型
D(X)=E{ [X−E(X)]2} D(X) =E\{ [X-E(X)]^2\} D(X)=E{ [X−E(X)]2} - 连续型
D(X)=∫−∞+∞(x−E(X))2f(x)dx D(X) =\int_{- \infty}^{+ \infty}{(x-E(X))^2f(x)}dx D(X)=∫−∞+∞(x−E(X))2f(x)dx
协方差
Cov(X,Y)=E{ [X−E(X)][Y−E(Y)]} Cov(X, Y) = E\{ [X-E(X)] [Y-E(Y)]\} Cov(X,Y)=E{ [X−E(X)][Y−E(Y)]}
- 上面的公式适合离散型和连续型
相关系数(皮尔逊系数)
ρ(X,Y)=Cov(X,Y)D(X)D(Y) \rho(X,Y) = \frac{Cov(X,Y)}{\sqrt {D(X)} \sqrt {D(Y)}} ρ(X,Y)=D(X)D(Y)Cov(X,Y)- 衡量两个变量之间的相关程度。相关系数在-1到1之间,小于0表示负相关,大于0表示正相关。绝对值∣ρ(X,Y)∣|\rho(X,Y)|∣ρ(X,Y)∣ 表示相关度的大小。越接近1,相关度越大。
三、数理统计
概念
在数理统计中,称研究对象的全体为总体,通常用一个随机变量表示总体。组成总体的每个基本单元叫个体。从总体 XXX 中随机抽取一部分个体 X1,X2,...,XnX_1,X_2,...,X_nX1,X2,...,Xn ,称 X1,X2,...,XnX_1,X_2,...,X_nX1,X2,...,Xn 为取自 XXX 的容量为 nnn 的样本(这里的X1X_1X1是表示第一次随机试验它的取值有iii个用xix_ixi表示对应的结果,即为观测值)
统计量与抽样
数理统计的任务是采集和处理带有随机影响的数据,或者说收集样本并对之进行加工,对样本的研究推断总体(对总体得出一定的结论),这一过程称为为统计推断。在统计推断中,对样本进行加工整理,实际上就是根据样本计算出一些量,使得这些量能够将所研究问题的信息集中起来。这种根据样本计算出的量就是下面将要定义的统计量,因此,统计量是样本的某种函数
常用的统计量
1. 样本均值
设 X1,X2,...,XnX_1,X_2,...,X_nX1,X2,...,Xn 是总体 XXX 的一个简单随机样本,称
X‾=1n∑i=1nXi \overline X = \frac{1} {n} {\sum_{i=1}^{n}X_i} X=n1i=1∑nXi
为样本均值。通常用样本均值来估计总体分布的均值和对有关总体分布均值的假设作检验。
2. 样本方差
设 X1,X2,...,XnX_1,X_2,...,X_nX1,X2,...,Xn 是总体 XXX 的一个简单随机样本,X‾\overline XX 为样本均值,称
S2=1n−1∑i=1n(Xi−X‾)2 S^2 = \frac{1} {n-1} {\sum_{i=1}^{n}(X_i-\overline X)^2} S2=n−11i=1∑n(Xi−X)2
为样本方差。通常用样本方差来估计总体分布的方差和对有关总体分布均值或方差的假设作检验。
3. kkk阶样本原点矩
设 X1,X2,...,XnX_1,X_2,...,X_nX1,X

本文详细介绍了概率统计的核心概念,包括随机事件、随机变量、数理统计、描述性统计和常见分布。重点讲解了条件概率、数学期望、方差、偏度与峰度以及假设检验的基本步骤和统计量选择。通过实例解析了二项分布、泊松分布、正态分布等常见概率分布,并探讨了参数估计和方差分析的思想。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



