数理统计的基本概念(一)

总体、样本与统计量

总体及其分布

在数理统计中,称所研究的对象的全体为总体,总体中的元素称为个体。若总体中的个体数目为有限,则称之为有限总体;否则就称之为无限总体

理解总体与个体:一批灯管10万支,在研究这批灯管的平均使用寿命时,该批灯管的全部使用寿命就组成一个总体,而其中每个灯管的使用寿命是个体。

数理统计所关心的并非每个个体的所有属性,而是它的某一项或若干项数量指标 X X X 和该数量指标 X X X 在总体中的分布情况。一方面,说到总体必对应某数量指标 X X X 可能取值的集合;另一方面,研究任意数量指标 X X X,其可能取值的全体即构成一个总体。因此,把二者等同起来,所谓总体的分布就是指数量指标 X X X 的分布

数量指标 X X X 是一个随机变量,于是总体的分布也就是随机变量 X X X 的概率分布。

样本及其分布

从总体中取得一部分个体,这一部分个体称为样本。样本中的每个个体称为样品。样品中的个体数目称为样本容量

取得样本的过程称为抽样,抽样中采用的方法称为抽样法。在数理统计中,一般采用随机抽样法,即从总体中随意地抽取若干个个体。

设由样本 X 1 , . . . , X n X_1,...,X_n X1,...,Xn,若 X 1 , . . . , X n X_1,...,X_n X1,...,Xn 是独立同分布的且 X 1 X_1 X1 的分布与总体 X X X 的分布相同,则称它为简单随机样本

说样本 ( X 1 , . . . , X n ) T (X_1,...,X_n)^T (X1,...,Xn)T n n n 维随机向量,这是针对进行一次抽样前而言,实施了一次抽样后,得到的是一个实向量 ( x 1 , . . . x n ) T (x_1,...x_n)^T (x1,...xn)T,它是样本 ( X 1 , . . . , X n ) T (X_1,...,X_n)^T (X1,...,Xn)T 的一个观察值,称为样本值

统计量

统计量概念

样本是推断总体特性的依据,但在获得样本之后,并不能由样本直接进行统计推断,需要先对样本进行加工和提炼,把样本中所含的总体的相关信息集中起来,即,针对不同的问题构造出样本的适当函数。这种样本的函数就称为统计量

( X 1 , . . . , X n ) T (X_1,...,X_n)^T (X1,...,Xn)T 为总体 X X X 的一个样本,若 g ( x 1 , . . . , x n ) g(x_1,...,x_n) g(x1,...,xn) 为样本空间 X \mathcal{X} X R k \mathbf{R}^k Rk 的可测映射,且 g g g 中不含任何未知参数,则称 t = g ( X 1 , . . . , X n ) t=g(X_1,...,X_n) t=g(X1,...,Xn) 为统计量。

粗略来说,统计量就是用作统计的量,因而它不能含未知参数

样本矩

( X 1 , . . . , X n ) (X_1,...,X_n) (X1,...,Xn) 为总体 X X X 的一个样本,称统计量 X ˉ = 1 n ∑ i = 1 n X i \bar{X}=\frac{1}{n}\sum_{i=1}^n X_i Xˉ=n1i=1nXi样本均值;称统计量 S 2 = 1 n ∑ i = 1 n ( X i − X ˉ ) 2 = 1 n ∑ i = 1 n X i 2 − X ˉ 2 S^2=\frac{1}{n}\sum_{i=1}^n(X_i-\bar{X})^2=\frac{1}{n}\sum_{i=1}^n X_i^2 - \bar{X}^2 S2=n1i=1n(XiXˉ)2=n1i=1nXi2Xˉ2 S ∗ 2 = 1 n − 1 ∑ i = 1 n ( X i − X ˉ ) 2 S^{*2}=\frac{1}{n-1}\sum_{i=1}^n(X_i-\bar{X})^2 S2=n11i=1n(XiXˉ)2 分别为样本方差修正样本方差,称样本方差的算数根 S = S 2 S=\sqrt{S^2} S=S2 样本标准差;称统计量 A k = 1 n ∑ i = 1 n X i k A_k=\frac{1}{n}\sum_{i=1}^n X_i^k Ak=n1i=1nXik B k = 1 n ∑ i = 1 n ( X i − X ˉ ) k B_k=\frac{1}{n}\sum_{i=1}^n(X_i-\bar{X})^k Bk=n1i=1n(XiXˉ)k 分别为样本 k k k 阶原点矩样本 k k k 阶中心矩

由大数定律可以证明,当 n n n 很大时,可用一次抽样后所得的样本均值 x ˉ \bar{x} xˉ 和样本方差 s 2 s^2 s2 分别作为总体 X X X 的均值 μ \mu μ 和方差 σ 2 \sigma^2 σ2 的近似值。

顺序统计量及其分布

( X 1 , . . . , X n ) T (X_1,...,X_n)^T (X1,...,Xn)T 为总体 X X X 的一个样本,其观察值为 ( x 1 , . . . , x n ) T (x_1,...,x_n)^T (x1,...,xn)T,将 x 1 , . . . , x n x_1,...,x_n x1,...,xn 由小到大进行排列,依次记为 x ( 1 ) , . . . , x ( n ) x_{(1)},...,x_{(n)} x(1),...,x(n),即 x ( 1 ) ≤ . . . ≤ x ( n ) x_{(1)}\le...\le x_{(n)} x(1)...x(n)。按下述方法定义统计量 X ( k ) X_{(k)} X(k):当样本 ( X 1 , . . . , X n ) T (X_1,...,X_n)^T (X1,...,Xn)T 取值为 ( x 1 , . . . , x n ) T (x_1,...,x_n)^T (x1,...,xn)T 时,规定 X ( k ) X_{(k)} X(k) 取值为 x ( k ) x_{(k)} x(k),由此得到的 ( X ( 1 ) , . . . , X ( n ) ) T (X_{(1)},...,X_{(n)})^T (X(1),...,X(n))T 称为样本 ( X 1 , . . . , X n ) T (X_1,...,X_n)^T (X1,...,Xn)T顺序统计量或次序统计量, X ( k ) X_{(k)} X(k) 称为样本 ( X 1 , . . . , X n ) T (X_1,...,X_n)^T (X1,...,Xn)T 的第 k k k 个顺序统计量, X ( 1 ) X_{(1)} X(1) 称为样本 ( X 1 , . . . , X n ) T (X_1,...,X_n)^T (X1,...,Xn)T 的最小顺序统计量, X ( n ) X_{(n)} X(n) 称为样本 ( X 1 , . . . , X n ) T (X_1,...,X_n)^T (X1,...,Xn)T 的最大顺序统计量。

样本中位数与样本极差

( X 1 , . . . , X n ) T (X_1,...,X_n)^T (X1,...,Xn)T 为总体 X X X 的一个样本,其顺序统计量为 ( X ( 1 ) , . . . , X ( n ) ) T (X_{(1)},...,X_{(n)})^T (X(1),...,X(n))T,由 ( X ( 1 ) , . . . , X ( n ) ) T (X_{(1)},...,X_{(n)})^T (X(1),...,X(n))T 可定义在应用上有重要意义的样本中位数与样本极差。

称统计量
M e = { X ( ( n + 1 ) / 2 ) , n 为奇数 1 2 ( X ( n / 2 ) + X ( ( n + 1 ) / 2 ) ) , n 为偶数 Me=\begin{cases} X_{((n+1)/2)}, &n 为奇数 \\ \frac{1}{2}(X_{(n/2)}+X_{((n+1)/2)}), &n 为偶数 \end{cases} Me={X((n+1)/2),21(X(n/2)+X((n+1)/2)),n为奇数n为偶数
样本中位数。样本中位数具有计算方便且不受样本值中的异常值 (outlier) 影响的特点,因而有时比样本均值更具有代表性。

称统计量
R = X ( n ) − X ( 1 ) R=X_{(n)}-X_{(1)} R=X(n)X(1)
样本极差。样本极差是反映样本值分散程度的量。

经验分布函数

( X 1 , . . . , X n ) T (X_1,...,X_n)^T (X1,...,Xn)T 为总体 X X X 的一个样本,其顺序统计量为 ( X ( 1 ) , . . . , X ( n ) ) T (X_{(1)},...,X_{(n)})^T (X(1),...,X(n))T。当样本的观察值为 ( x 1 , . . . , x n ) T (x_1,...,x_n)^T (x1,...,xn)T 时,顺序统计量的观察值为 ( x ( 1 ) , . . . , x ( n ) ) T (x_{(1)},...,x_{(n)})^T (x(1),...,x(n))T,对任意实数 x x x,记 F n ( x ) = { 0 , x < x ( 1 ) k n , x ( k ) ≤ x < x ( k + 1 ) , k = 1 , 2 , . . . , n − 1 1 , x ( n ) ≤ x F_n(x)=\begin{cases}0, &x<x_{(1)}\\ \frac{k}{n}, &x_{(k)}\le x <x_{(k+1)},k=1,2,...,n-1\\ 1, &x_{(n)}\le x \end{cases} Fn(x)= 0,nk,1,x<x(1)x(k)x<x(k+1),k=1,2,...,n1x(n)x 则称 F n ( x ) F_n(x) Fn(x)经验分布函数

经验分布函数的性质:

  1. F n ( x ) F_n(x) Fn(x) x x x 的单调非降函数;
  2. F n ( x ) F_n(x) Fn(x) x x x 的右连续函数;
  3. F n ( − ∞ ) = 0 , F n ( + ∞ ) = 1 F_n(-\infty)=0,F_n(+\infty)=1 Fn()=0,Fn(+)=1

参考文献

[1] 《应用数理统计》,施雨,西安交通大学出版社。

### 回答1: 《数理统计基本概念李泽慧pdf》是本专门介绍数理统计基本概念的资料。数理统计是应用数学方法来研究随机现象的门学科,它主要关注如何通过对组观测数据进行处理分析来得出有关总体特征的推断。 在这本资料中,李泽慧首先介绍了数理统计基本概念,如总体、样本、随机变量、统计量等。总体指的是研究对象的全体,而样本是从总体中选取的部分个体。在统计过程中,我们通常会对样本进行观测测量,得到样本数据。 接着,李泽慧详细讲解了概率分布及其特征。概率分布描述了随机变量的取值与其概率之间的关系。常见的概率分布有离散分布连续分布。在统计分析中,我们经常使用参数来刻画概率分布的特征,例如均值、方差等。同时,李泽慧还介绍了常见的概率分布,如正态分布、二项分布等。 此外,李泽慧还讨论了数理统计的推断方法,包括参数估计假设检验。参数估计是利用样本数据来推断总体特征的方法,它可以通过最大似然估计、矩估计等方法进行。而假设检验则是用来验证关于总体特征的假设是否成立的方法。通过设立原假设备择假设,并进行适当的假设检验统计量计算判断,我们可以对总体特征作出推断。 总之,《数理统计基本概念李泽慧pdf》是本全面介绍数理统计基本概念的资料,它涵盖了总体、样本、概率分布、参数估计假设检验等重要内容,并提供了具体的定义方法。这本资料对于初学者数理统计感兴趣的人士来说是本很有价值的参考书。 ### 回答2: 《数理统计基本概念李泽慧pdf》是本关于数理统计基本概念的教材或学习资料。数理统计是应用数学的门学科,研究收集、整理、分析解释数据的方法原理。这本pdf涵盖了数理统计基本概念,可以帮助读者理解数理统计的基础知识方法。 首先,数理统计研究的对象是数据。数据是对某现象进行测量或观察得到的结果。在数理统计中,数据以变量的形式呈现,可以是定量变量或定性变量。定量变量可以进行数值计量,如身高、体重等;定性变量是没有数值大小的变量,如性别、颜色等。 其次,数理统计中的个重要概念是概率分布。概率分布描述了个变量的所有可能取值及其出现的概率。常见的概率分布有正态分布、泊松分布、指数分布等。 另外,样本总体也是数理统计中的重要概念。总体是指研究对象的全体,而样本是从总体中抽取的部分观测结果。通过对样本进行统计分析,可以对总体的特征进行推断。 此外,数理统计中还有估计假设检验的概念。估计是根据样本数据推断总体平均值、方差等参数的过程,常见的估计方法有点估计区间估计。假设检验是根据样本数据判断总体参数是否符合某种假设,常用的假设检验方法有t检验、方差分析等。 总之,《数理统计基本概念李泽慧pdf》是本涵盖了数理统计基本概念的教材或学习资料,通过阅读学习该资料,可以帮助读者理解数理统计的基础知识方法,包括数据、概率分布、样本与总体、估计假设检验等概念。 ### 回答3: 《数理统计基本概念》是李泽慧编写的本关于数理统计基础知识的PDF教材。数理统计统计学的门重要分支,主要研究概率统计数理统计方法在实际问题中的应用。这本教材主要从基本概念入手,系统地介绍了数理统计的相关内容。 教材首先介绍了概率论的基础知识,如概率的定义、加法定理、条件概率等。然后,通过详细的数学推导,引入了随机变量概率分布,包括离散型随机变量连续型随机变量的概念与性质。接着,教材介绍了多个重要的离散分布连续分布,如二项分布、正态分布等,并深入讨论了它们的性质应用。 随后,教材转向了统计学的基本概念。它详细介绍了随机样本样本分布的定义,以及描述统计量、抽样分布的概念。此外,教材还介绍了常用的统计推断方法,如参数估计假设检验,并给出了具体的计算步骤实际应用的例子。 最后,教材还简要介绍了简单线性回归分析相关性分析的基本方法。它解释了回归相关性的概念,并详细介绍了两者的计算公式应用场景。 总的来说,《数理统计基本概念》这本教材系统地介绍了数理统计的基础知识,涵盖了概率论、随机变量、概率分布、统计推断以及回归分析等内容。它既适用于学习数理统计的初学者,也适用于需要复习巩固基础知识的人群。教材内容丰富,具有很高的实用性,对于提高统计学应用能力有较好的指导作用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

如松茂矣

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值