概率论考研笔记(四):数理统计
概念 | 释义 | 性质 |
---|---|---|
总体 | 研究对象的全体 | 如果总体所包含的个体数量有限,称有限总体,反之称无限总体 |
个体 | 总体中的每个成员 | |
简单随机样本 | 从总体中随机抽取的用于研究的个体,且符合: ①代表性:样本能够代表总体,即样本中的每个分量与总体同分布; ②独立性:样本中的每个分量相互独立 | 简称样本; 抽得样本的过程称为抽样; 样本中个体的数量称为样本容量; 对样本进行了若干次观测所得到的一组数据称为样本值; 设总体X的分布函数为F(x)、概率密度为f(x),则样本 ( X 1 , X 2 , . . , X n ) (X_1,X_2,..,X_n) (X1,X2,..,Xn)的分布函数为: F ( x 1 , x 2 , . . , x n ) = ∏ F ( x i ) F(x_1,x_2,..,x_n) = \prod F(x_i) F(x1,x2,..,xn)=∏F(xi),概率密度为: f ( x 1 , x 2 , . . . , x n ) = ∏ f ( x i ) f(x_1,x_2,...,x_n) = \prod f(x_i) f(x1,x2,...,xn)=∏f(xi) |
统计量 | 设 ( X 1 , X 2 , . . , X n ) (X_1,X_2,..,X_n) (X1,X2,..,Xn)为总体X的一个样本, T ( x 1 , x 2 , . . , x n ) T(x_1,x_2,..,x_n) T(x1,x2,..,xn)为不含任何未知参数的函数,则称 T ( X 1 , X 2 , . . , X n ) T(X_1,X_2,..,X_n) T(X1,X2,..,Xn)为一个统计量 | 统计量是样本的函数,且不含任何未知参数; 统计量的分布称为抽样分布 |
估计量/估计值 | 设总体的分布为 F ( x ; θ ) F(x;\theta) F(x;θ),其中 θ = ( θ 1 , θ 2 , . . . , θ k ) \theta = (\theta_1,\theta_2,...,\theta_k) θ=(θ1,θ2,...,θk)为未知参数组成的k维向量,若根据样本 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn构造一个统计量 θ ′ ( X 1 , X 2 , . . . , X n ) \theta'(X_1,X_2,...,X_n) θ′(X1,X2,...,Xn)作为 θ \theta θ的估计,则称该统计量为 θ \theta θ的估计量,代入样本值 x 1 , x 2 , . . . , x n x_1,x_2,...,x_n x1,x2,...,xn得到的具体值 θ ′ ( x 1 , x 2 , . . . , x n ) \theta'(x_1,x_2,...,x_n) θ′(x1,x2,...,xn)称为 θ \theta θ的估计值 | 主要用于点估计中; 估计量的评价标准: ①无偏性: E [ θ ′ ] = θ E[\theta'] = \theta E[θ′]=θ,即估计量平均来看等于未知参数,无系统误差; ②有效性:均方误差 E ( θ ′ − θ ) 2 E(\theta'-\theta)^2 E(θ′−θ)2尽量小; ③一致性/相合性: θ ′ → P θ \theta'\xrightarrow{P} \theta θ′Pθ |
置信区间 | 设 θ \theta θ是X的未知参数, X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn是其一个样本,若对事先给定的常数 α ( 0 < α < 1 ) \alpha(0<\alpha<1) α(0<α<1),存在两个统计量 θ 1 ′ ( X 1 , X 2 , . . . , X n ) \theta_1'(X_1,X_2,...,X_n) θ1′(X1,X2,...,Xn)和 θ 2 ′ ( X 1 , X 2 , . . . , X n ) \theta_2'(X_1,X_2,...,X_n) θ2′(X1,X2,...,Xn)使得 P ( θ 1 ′ < θ < θ 2 ′ ) = 1 − α P(\theta_1' < \theta < \theta_2') = 1 - \alpha P(θ1′<θ<θ2′)=1−α,则称区间 ( θ 1 ′ , θ 2 ′ ) (\theta_1',\theta_2') (θ1′,θ2′)为 θ \theta θ的置信度为 1 − α 1- \alpha 1−α,置信下限为 θ 1 ′ \theta_1' θ1′,置信上限为 θ 2 ′ \theta_2' θ2′的置信区间 | 主要用于区间估计中 |
参数估计 | 当总体的分布类型已知但是其中某些参数未知时,利用样本构造合理的统计量对未知参数进行估计的过程称为参数估计 | 参数估计分为点估计和区间估计,前者直接给出未知参数的估计量/估计值;后者给出未知参数的置信区间 |
假设检验 | 对总体的某些未知特征提出假设,并利用样本信息来推断该假设的正确性 | 如果抽样检测出来的实际观测数据在假设的前提下发生的概率很小,根据小概率原理,可认为该假设很大概率上是错误的; 但是判断出错的可能性仍然是存在的,主要有两类错误: ①拒真错误,即假设为真但是最终判定为拒绝假设; ②取伪错误,即假设为假但是最终判定为接受假设; 两类错误相互矛盾,除了增加样本容量之外,没有方法可以同时减小两类错误,因此通常采用纽曼-皮尔逊准则: 首先控制第一类错误的概率,再尽量减小第二类错误的概率 |
上 α \alpha α分位点 | 设X为一个随机变量,对于给定的数 α ( 0 < α < 1 ) \alpha(0 < \alpha < 1) α(0<α<1),称满足条件 P ( X > λ α ) = α P(X > \lambda_{\alpha}) = \alpha P(X>λα)=α的实数 λ α \lambda_{\alpha} λα为X的上 α \alpha α分位点 | 当X分别服从 N ( 0 , 1 ) N(0,1) N(0,1)、 χ 2 ( n ) \chi^2(n) χ2(n)、 t ( n ) t(n) t(n)、 F ( n 1 , n 2 ) F(n_1,n_2) F(n1,n2)时,其上 α \alpha α分位点分别记为 z α z_{\alpha} zα、 χ α 2 ( n ) \chi^2_{\alpha}(n) χα2(n)、 t α ( n ) t_{\alpha}(n) tα(n)、 F α ( n 1 , n 2 ) F_{\alpha}(n_1,n_2) Fα(n1,n2) |
-
大数定律:
对于随机变量序列{ X n X_n Xn},若 1 n ∑ i = 1 n ( X i − E X i ) → P 0 \frac{1}{n}\sum_{i=1}^{n}(X_i-EX_i)\xrightarrow{P}0 n1∑i=1n(Xi−EXi)P0,则称 { X n } \{X_n\} {Xn}服从大数定律,常用的大数定律如下:
(1)切比雪夫大数定律:若 { X n } \{X_n\} {Xn}为两两不相关的随机变量序列,且存在常数 C C C使得对于任意随机变量 X i X_i Xi,有 D ( X i ) ≤ C D(X_i)\leq C D(Xi)≤C,则 { X n } \{X_n\} {Xn}服从大数定律;
(2)辛钦大数定律:若 { X n } \{X_n\} {Xn}为一列独立同分布的随机变量,设 E X n = μ , D X n = σ 2 < ∞ EX_n=\mu,DX_n = \sigma^2<\infty EXn=μ,DXn=σ2<∞,则: 1 n ∑ i = 1 n X i → P μ \frac{1}{n}\sum_{i=1}^{n}X_i\xrightarrow{P}\mu n1∑i=1nXiPμ,即样本均值依概率收敛到总体均值(可推广到k阶距);
(3)伯努利大数定律:设 n A n_A nA为n重伯努利试验中事件A发生的频数,p为其每次试验发生的概率,则 n A n → P p \frac{n_A}{n}\xrightarrow{P}p nnAPp,即事件A发生的频率依概率收敛到A发生的概率;
-
中心极限定理:
对于相互独立的随机变量序列{ X n X_n Xn},若其标准化随机变量: X ∗ = ∑ ( X i − E X i ) D X i X^* = \sum\frac{(X_i-EX_i)}{\sqrt{ DX_i}} X∗=∑DXi(Xi−EXi)对于任意实数x,均有: lim n → ∞ F X ∗ ( x ) = Φ ( x ) \lim\limits_{n\rightarrow \infty} F_{X^*}(x) = \Phi(x) n→∞limFX∗(x)=Φ(x),则称 { X n } \{X_n\} {Xn}服从中心极限定理,常用的中心极限定理如下:
(1)列维-林德伯格中心极限定理:若 { X n } \{X_n\} {Xn}为一列独立同分布的随机变量,设 E X n = μ , D X n = σ 2 < ∞ EX_n=\mu,DX_n = \sigma^2<\infty EXn=μ,DXn=σ2<∞,则 { X n } \{X_n\} {Xn}服从中心极限定理,即: ∑ X i \sum X_i ∑Xi近似服从 N ( n μ , n σ 2 ) N(n\mu,n\sigma^2) N(nμ,nσ2);
(2)棣莫弗-拉普拉斯中心极限定理:若随机变量 X n X_n Xn服从二项分布 B ( n , p ) B(n,p) B(n,p),则两点分布列 { X n } \{X_n\} {Xn}服从中心极限定理,即 X n X_n Xn近似服从 N ( n p , n p ( 1 − p ) ) N(np,np(1-p)) N(np,np(1−p));
(3)林德伯格-费勒中心极限定理:若{ X n X_n Xn}是独立的随机变量序列,设 B n = ∑ σ i 2 B_n = \sum \sigma_i^2 Bn=∑σi2,则若对任何 ϵ > 0 \epsilon >0 ϵ>0,都有:
lim n → ∞ 1 B n 2 ∑ E [ ( X i − E X i ) 2 ∗ I { a b s ( X i − E X i ) > ϵ ∗ B n } ] = 0 \lim_{n\rightarrow \infty}\frac{1}{B_n^2}\sum E[(X_i-EX_i)^2*I_{\{abs(X_i-EX_i)>\epsilon*B_n\}}] = 0 limn→∞Bn21∑E[(Xi−EXi)2∗I{abs(Xi−EXi)>ϵ∗Bn}]=0,
则 { X n } \{X_n\} {Xn}服从中心极限定理;
矩统计量 | 表达式 | 性质 |
---|---|---|
样本均值 X ‾ \overline X X | X ‾ = 1 n ∑ i = 1 n X i \overline X = \frac{1}{n}\sum_{i=1}^n X_i X=n1∑i=1nXi | 若总体X的期望为
μ
\mu
μ,方差为
σ
2
\sigma^2
σ2,则根据列维-林德伯格中心极限定理,样本均值
X
‾
\overline X
X近似服从
N
(
μ
,
σ
2
n
)
N(\mu,\frac{\sigma^2}{n})
N(μ,nσ2); E ( X ‾ ) = μ , D ( X ‾ ) = σ 2 n E(\overline X) =\mu,D(\overline X)=\frac{\sigma^2}{n} E(X)=μ,D(X)=nσ2 |
样本方差 S 2 S^2 S2 | S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ‾ ) 2 S^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \overline X)^2 S2=n−11∑i=1n(Xi−X)2 |
E
(
S
2
)
=
σ
2
,
D
(
S
2
)
=
2
σ
4
n
−
1
E(S^2)=\sigma^2,D(S^2)=\frac{2\sigma^4}{n-1}
E(S2)=σ2,D(S2)=n−12σ4; S称为样本标准差; X ‾ \overline X X与 S 2 S^2 S2相互独立; 设 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn时来自正态总体 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)的样本,则: ① X ‾ ~ N ( μ , σ 2 n ) \overline X ~ N(\mu,\frac{\sigma^2}{n}) X~N(μ,nσ2); ② ( n − 1 ) S 2 σ 2 = ∑ ( X i − X ‾ ) 2 σ 2 ~ χ 2 ( n − 1 ) \cfrac{(n-1)S^2}{\sigma^2} = \cfrac{\sum(X_i-\overline X)^2}{\sigma^2}~\chi^2(n-1) σ2(n−1)S2=σ2∑(Xi−X)2~χ2(n−1); ③ X ‾ − μ S n ~ t ( n − 1 ) \cfrac{\overline X - \mu}{\frac{S}{\sqrt{n}}}~t(n-1) nSX−μ~t(n−1); ④ ∑ ( X i − μ ) 2 σ 2 ~ χ 2 ( n ) \cfrac{\sum(X_i-\mu)^2}{\sigma^2}~\chi^2(n) σ2∑(Xi−μ)2~χ2(n) |
样本k阶原点矩 A k A_k Ak | A k = 1 n ∑ i = 1 n X i k A_k = \frac{1}{n} \sum_{i=1}^n X_i^k Ak=n1∑i=1nXik | 样本均值即为样本1阶原点矩 |
样本k阶中心距 B k B_k Bk | B k = 1 n ∑ i = 1 n ( X i − X ‾ ) k B_k = \frac{1}{n} \sum_{i=1}^n (X_i-\overline X)^k Bk=n1∑i=1n(Xi−X)k | 样本方差不是样本2阶中心距; 样本二阶中心矩又记作 S ∗ 2 S^{*2} S∗2 |
分布名称 | 参数 | 概率密度 | 期望 | 方差 | 模型 / 性质 |
---|---|---|---|---|---|
χ 2 \chi^2 χ2分布 | n n n | f ( x ) = { exp ( − x 2 ) x n 2 − 1 2 n 2 Γ ( n 2 ) x > 0 0 x ≤ 0 f(x)=\begin{cases}\cfrac{\exp(\frac{-x}{2})x^{\frac{n}{2}-1}}{2^\frac{n}{2}\Gamma(\frac{n}{2})}&x>0\\0&x\le0 \end{cases} f(x)=⎩⎪⎨⎪⎧22nΓ(2n)exp(2−x)x2n−10x>0x≤0 | n n n | 2 n 2n 2n | 设
X
1
,
X
2
,
.
.
.
,
X
n
X_1,X_2,...,X_n
X1,X2,...,Xn为相互独立的随机变量,且均服从标准正态分布,则称随机变量
χ
2
=
∑
X
i
2
\chi^2 = \sum X_i^2
χ2=∑Xi2为服从自由度为n的
χ
2
\chi^2
χ2分布,记为
χ
2
~
χ
2
(
n
)
\chi^2 ~ \chi^2(n)
χ2~χ2(n); ①若 χ 1 2 ~ χ 2 ( n 1 ) , χ 2 2 ~ χ 2 ( n 2 ) \chi_1^2 ~ \chi^2(n_1),\chi_2^2 ~ \chi^2(n_2) χ12~χ2(n1),χ22~χ2(n2),且相互独立,则 χ 1 2 + χ 2 2 ~ χ 2 ( n 1 + n 2 ) \chi_1^2+\chi_2^2 ~ \chi^2(n_1+n_2) χ12+χ22~χ2(n1+n2); ②当n很大时(一般大于40), χ α 2 ( n ) ≈ 1 2 ( u α + 2 n − 1 ) 2 \chi_{\alpha}^2(n) \approx \frac{1}{2}(u_{\alpha}+\sqrt{2n-1})^2 χα2(n)≈21(uα+2n−1)2 |
t t t分布 | n n n | f ( x ) = { Γ ( n + 1 2 ) n π Γ ( n 2 ) ( 1 + x 2 n ) − n + 1 2 f(x) = \begin{cases}\cfrac{\Gamma(\frac{n+1}{2})}{\sqrt{n\pi}\Gamma(\frac{n}{2})}(1+\frac{x^2}{n})^{-\frac{n+1}{2}} \end{cases} f(x)={nπΓ(2n)Γ(2n+1)(1+nx2)−2n+1 | 0 0 0 |
n
n
−
2
\frac{n}{n-2}
n−2n ( n > 2 ) (n > 2) (n>2) | 设
X
~
N
(
0
,
1
)
X~N(0,1)
X~N(0,1),
Y
~
χ
2
(
n
)
Y~\chi^2(n)
Y~χ2(n),且X与Y相互独立,则称随机变量
T
=
X
Y
n
T = \frac{X}{\sqrt{\frac{Y}{n}}}
T=nYX服从自由度为n的t分布,记为
T
~
t
(
n
)
T~t(n)
T~t(n); ①f(x)是偶函数; ②当 n → ∞ n \rightarrow \infty n→∞时, t ( n ) → N ( 0 , 1 ) t(n)\rightarrow N(0,1) t(n)→N(0,1); ③当n较小时,t分布与标准正态分布差别较大; ④当n=1时, f ( x ) = 1 π ( 1 + x 2 ) f(x) = \frac{1}{\pi (1+x^2)} f(x)=π(1+x2)1,即 t ( 1 ) t(1) t(1)为柯西分布; ⑤当n较大时(一般大于45), t α ( n ) ≈ u α t_{\alpha}(n) \approx u_{\alpha} tα(n)≈uα; ⑥ t α ( n ) = − t 1 − α ( n ) t_{\alpha}(n) = -t_{1-\alpha}(n) tα(n)=−t1−α(n) |
F F F分布 | n 1 , n 2 n_1,n_2 n1,n2 | f ( x ) = { Γ ( n 1 + n 2 2 ) Γ ( n 1 2 ) Γ ( n 2 2 ) ( n 1 n 2 ) n 1 2 x n 1 2 − 1 ( 1 + n 1 n 2 x ) − n 1 + n 2 2 x > 0 0 x ≤ 0 f(x) = \begin{cases}\cfrac{\Gamma(\frac{n_1+n_2}{2})}{\Gamma(\frac{n_1}{2})\Gamma(\frac{n_2}{2})}(\frac{n_1}{n_2})^{\frac{n_1}{2}}x^{\frac{n_1}{2}-1}(1+\frac{n_1}{n_2}x)^{-\frac{n_1+n_2}{2}} &x>0\\0&x\le0\end{cases} f(x)=⎩⎪⎨⎪⎧Γ(2n1)Γ(2n2)Γ(2n1+n2)(n2n1)2n1x2n1−1(1+n2n1x)−2n1+n20x>0x≤0 | n 2 n 2 − 2 \cfrac{n_2}{n_2-2} n2−2n2 | 2 n 2 2 ( n 1 + n 2 − 2 ) n 1 ( n 2 − 2 ) 2 ( n 2 − 2 ) \cfrac{2n_2^2(n_1+n_2-2)}{n_1(n_2-2)^2(n_2-2)} n1(n2−2)2(n2−2)2n22(n1+n2−2) | 设
U
~
χ
2
(
n
1
)
U~\chi^2(n_1)
U~χ2(n1),
V
~
χ
2
(
n
2
)
V~\chi^2(n_2)
V~χ2(n2)且U和V相互独立,则称随机变量
F
=
U
/
n
1
V
/
n
2
F = \frac{U/n_1}{V/n_2}
F=V/n2U/n1服从自由度为(n1,n2)的F分布,记为
F
~
F
(
n
1
,
n
2
)
F~F(n_1,n_2)
F~F(n1,n2); ①若 F ~ F ( n 1 , n 2 ) F~F(n_1,n_2) F~F(n1,n2),则 1 F ~ F ( n 2 , n 1 ) \frac{1}{F}~F(n_2,n_1) F1~F(n2,n1); ②若 T ~ t ( n ) T~t(n) T~t(n),则 T 2 ~ F ( 1 , n ) T^2~F(1,n) T2~F(1,n); ③ F 1 − α ( n 1 , n 2 ) = 1 F α ( n 2 , n 1 ) F_{1-\alpha}(n_1,n_2) = \frac{1}{F_{\alpha}(n_2,n_1)} F1−α(n1,n2)=Fα(n2,n1)1 |
-
点估计:
(1)矩估计法:用样本矩代替总体距进行点估计(依据大数定律)
步骤 操作 公式 1 根据总体分布 F ( x ; θ ) F(x;\theta) F(x;θ)求总体的1~k阶原点矩 μ i \mu_i μi μ i = g i ( θ 1 , θ 2 , . . . , θ k ) \mu_i = g_i(\theta_1,\theta_2,...,\theta_k) μi=gi(θ1,θ2,...,θk) 2 解步骤1中的线性方程得到 θ i \theta_i θi的表达式 θ i = h i ( μ 1 , μ 2 , . . . , μ k ) \theta_i = h_i(\mu_1,\mu_2,...,\mu_k) θi=hi(μ1,μ2,...,μk) 3 用样本距 A i A_i Ai代替步骤2中的总体距 μ i \mu_i μi,即得矩估计 θ i ′ = h i ( A 1 , A 2 , . . . , A k ) \theta_i' = h_i(A_1,A_2,...,A_k) θi′=hi(A1,A2,...,Ak) (2)最大似然估计法:根据已有样本值,选择未知参数的一个合理的估计值,使得参数在选取该估计值时样本得到该批样本值的可能性达到最大
步骤 操作 公式 1 根据总体分布的概率密度 f ( x ; θ ) f(x;\theta) f(x;θ)得到样本 X 1 , X 2 , . . , X n X_1,X_2,..,X_n X1,X2,..,Xn的联合密度/似然函数 L L L或联合密度的对数/对数似然函数 ln L \ln L lnL L ( x 1 , , , x n ; θ ) = ∏ f ( x i ; θ ) L(x_1,,,x_n;\theta) = \prod f(x_i;\theta) L(x1,,,xn;θ)=∏f(xi;θ);
ln L ( x 1 , , , x n ; θ ) = ∑ ln f ( x i ; θ ) \ln L(x_1,,,x_n;\theta) = \sum \ln f(x_i;\theta) lnL(x1,,,xn;θ)=∑lnf(xi;θ)2 将步骤1得到的似然函数/对数似然函数对 θ \theta θ求导,得到似然方程(组) d d θ L ( x 1 , . . , x n ; θ ) = 0 \frac{d}{d \theta}L(x_1,..,x_n;\theta) = 0 dθdL(x1,..,xn;θ)=0或
d d θ ln L ( x 1 , . . , x n ; θ ) = 0 \frac{d}{d \theta}\ln L(x_1,..,x_n;\theta) = 0 dθdlnL(x1,..,xn;θ)=03 解步骤2中得到的似然方程(组),得到 θ \theta θ的极大似然估计值,再进一步判断可得到最大似然估计值 θ ′ = θ 0 \theta' = \theta_0 θ′=θ0,其中 L ( x 1 , . . , x n ; θ 0 ) = L m a x ( x 1 , . . , x n ; θ ) L(x_1,..,x_n;\theta_0) = L_{max}(x_1,..,x_n;\theta) L(x1,..,xn;θ0)=Lmax(x1,..,xn;θ)
-
区间估计:
(1)枢轴变量法通用步骤:
步骤 操作 公式 1 找到一个样本函数 U ( X 1 , X 2 , . . , X n ; θ ) U(X_1,X_2,..,X_n;\theta) U(X1,X2,..,Xn;θ),而 U U U的分布已知且不依赖任何未知参数,称该 U U U为枢轴变量 例如:令 U U U为标准化正态样本均值 X ‾ − μ σ / n ~ N ( 0 , 1 ) \frac{\overline X-\mu}{\sigma / \sqrt{n}}~N(0,1) σ/nX−μ~N(0,1) 2 对给定的置信度 1 − α 1-\alpha 1−α,根据U的分布找到两个常数a,b,使得: P ( a < U < b ) = 1 − α P(a<U<b) = 1-\alpha P(a<U<b)=1−α 承接步骤1例: P ( − u α / 2 < X ‾ − μ σ / n < u α / 2 ) = 1 − α P(-u_{\alpha/2}<\frac{\overline X-\mu}{\sigma / \sqrt{n}}<u_{\alpha/2}) = 1-\alpha P(−uα/2<σ/nX−μ<uα/2)=1−α 3 解步骤2括号中不等式,得到置信区间 ( θ 1 ′ , θ 2 ′ ) (\theta_1',\theta_2') (θ1′,θ2′) 承接步骤2中例: − u α / 2 < X ‾ − μ σ / n < u α / 2 ⇒ μ 1 ′ < μ < μ 2 ′ ⇒ ( μ 1 ′ , μ 2 ′ ) -u_{\alpha/2}<\frac{\overline X-\mu}{\sigma / \sqrt{n}}<u_{\alpha/2} \Rightarrow \mu_1' < \mu < \mu_2' \Rightarrow (\mu_1',\mu_2') −uα/2<σ/nX−μ<uα/2⇒μ1′<μ<μ2′⇒(μ1′,μ2′) (2)单正态总体 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)下的区间估计:
未知参数 条件 枢轴变量U 近似分布 μ \mu μ σ 2 \sigma^2 σ2已知 X ‾ − μ σ / n \frac{\overline X-\mu}{\sigma / \sqrt{n}} σ/nX−μ N ( 0 , 1 ) N(0,1) N(0,1) μ \mu μ σ 2 \sigma^2 σ2未知 X ‾ − μ S / n \frac{\overline X-\mu}{S / \sqrt{n}} S/nX−μ t ( n − 1 ) t(n-1) t(n−1) σ 2 \sigma^2 σ2 μ \mu μ已知 Σ ( X − μ ) 2 σ 2 \frac{\Sigma( X-\mu)^2}{\sigma^2} σ2Σ(X−μ)2 χ 2 ( n ) \chi^2(n) χ2(n) σ 2 \sigma^2 σ2 μ \mu μ未知 ( n − 1 ) S 2 σ 2 \frac{(n-1)S^2}{\sigma^2} σ2(n−1)S2 χ 2 ( n − 1 ) \chi^2(n-1) χ2(n−1) (3)双正态总体 N ( μ 1 , σ 1 2 ) N(\mu_1,\sigma_1^2) N(μ1,σ12), N ( μ 2 , σ 2 2 ) N(\mu_2,\sigma_2^2) N(μ2,σ22)下的区间估计:
未知参数 条件 枢轴变量U 近似分布 μ 1 − μ 2 \mu_1-\mu_2 μ1−μ2 σ 1 2 , σ 2 2 \sigma_1^2,\sigma_2^2 σ12,σ22已知 X ‾ − Y ‾ − ( μ 1 − μ 2 ) σ 1 2 n 1 + σ 2 2 n 2 \frac{\overline X-\overline Y-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} n1σ12+n2σ22X−Y−(μ1−μ2) N ( 0 , 1 ) N(0,1) N(0,1) μ 1 − μ 2 \mu_1-\mu_2 μ1−μ2 σ 1 2 , σ 2 2 \sigma_1^2,\sigma_2^2 σ12,σ22未知但 σ 1 = σ 2 \sigma_1=\sigma_2 σ1=σ2 X ‾ − Y ‾ − ( μ 1 − μ 2 ) S w 1 n 1 + 1 n 2 \frac{\overline X-\overline Y-(\mu_1-\mu_2)}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} Swn11+n21X−Y−(μ1−μ2)
S w = ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 S_w=\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2} Sw=n1+n2−2(n1−1)S12+(n2−1)S22t ( n 1 + n 2 − 2 ) t(n_1+n_2-2) t(n1+n2−2) σ 1 2 / σ 2 2 \sigma_1^2/\sigma_2^2 σ12/σ22 μ 1 , μ 2 \mu_1,\mu_2 μ1,μ2已知 ∑ ( X 1 − μ 1 ) 2 / n 1 ∑ ( X 2 − μ 2 ) 2 / n 2 \frac{\sum(X_1-\mu_1)^2/n_1}{\sum(X_2-\mu_2)^2/n_2} ∑(X2−μ2)2/n2∑(X1−μ1)2/n1 F ( n 1 , n 2 ) F(n_1,n_2) F(n1,n2) σ 1 2 / σ 2 2 \sigma_1^2/\sigma_2^2 σ12/σ22 μ 1 , μ 2 \mu_1,\mu_2 μ1,μ2未知 S 1 2 / S 2 2 σ 1 2 / σ 2 2 \frac{S_1^2/S_2^2}{\sigma_1^2/\sigma_2^2} σ12/σ22S12/S22 F ( n 1 − 1 , n 2 − 1 ) F(n_1-1,n_2-1) F(n1−1,n2−1)
-
假设检验:
(1)通用步骤:
步骤 操作 ①提出假设 原假设,即需要检验的假设,记为 H 0 H_0 H0;
备择假设:在拒绝 H 0 H_0 H0后可供选择的一个假设,记为 H 1 H_1 H1②构造检验统计量 U U U 构造一个合适的统计量(通常取原假设中未知参数的优良的估计量) ③定义显著性水平 α \alpha α 即一个小概率值 α \alpha α,描述在 H 0 H_0 H0成立的条件下 H 0 H_0 H0被拒绝的概率 ④确定拒绝域 W W W 即使得 H 0 H_0 H0被拒绝的样本观测值的集合W,再利用关系式 P ( U ∈ W ∥ H 0 ) ≤ α P(U \in W \| H_0) \leq \alpha P(U∈W∥H0)≤α解得拒绝域中U的取值范围 ⑤抽样检测 由样本算出检验统计量的观测值U‘,若U’落在拒绝域W中,则拒绝 H 0 H_0 H0;否则则接受 H 0 H_0 H0 (以下仅考虑双边检验( H 1 H_1 H1在 H 0 H_0 H0两侧),单边检验( H 1 H_1 H1和 H 0 H_0 H0各居一侧)可类比)
(2)单正态总体 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)下的假设检验:
原假设 H 0 H_0 H0 备择假设 H 1 H_1 H1 条件 检验统计量U 近似分布 拒绝域W μ = μ 0 \mu = \mu_0 μ=μ0 μ ≠ μ 0 \mu \neq \mu_0 μ=μ0 σ 2 \sigma^2 σ2已知 X ‾ − μ 0 σ / n \frac{\overline X-\mu_0}{\sigma / \sqrt{n}} σ/nX−μ0 N ( 0 , 1 ) N(0,1) N(0,1) W = { ∥ U ∥ ≥ z α / 2 } W = \{\|U\|\geq z_{\alpha/2}\} W={∥U∥≥zα/2} μ = μ 0 \mu = \mu_0 μ=μ0 μ ≠ μ 0 \mu \neq \mu_0 μ=μ0 σ 2 \sigma^2 σ2未知 X ‾ − μ 0 S / n \frac{\overline X-\mu_0}{S / \sqrt{n}} S/nX−μ0 t ( n − 1 ) t(n-1) t(n−1) W = { ∥ U ∥ ≥ t α / 2 ( n − 1 ) } W = \{\|U\|\geq t_{\alpha/2}(n-1)\} W={∥U∥≥tα/2(n−1)} σ 2 = σ 0 2 \sigma^2 = \sigma_0^2 σ2=σ02 σ 2 ≠ σ 0 2 \sigma^2 \neq \sigma_0^2 σ2=σ02 μ \mu μ已知 Σ ( X − μ ) 2 σ 0 2 \frac{\Sigma( X-\mu)^2}{\sigma_0^2} σ02Σ(X−μ)2 χ 2 ( n ) \chi^2(n) χ2(n) W = { U ≥ χ α / 2 2 ( n ) } ⋃ { U ≤ χ 1 − α / 2 2 ( n ) } W = \{U\geq \chi_{\alpha/2}^2(n)\} \bigcup \{U\leq \chi_{1-\alpha/2}^2(n)\} W={U≥χα/22(n)}⋃{U≤χ1−α/22(n)} σ 2 = σ 0 2 \sigma^2 = \sigma_0^2 σ2=σ02 σ 2 ≠ σ 0 2 \sigma^2 \neq \sigma_0^2 σ2=σ02 μ \mu μ未知 ( n − 1 ) S 2 σ 0 2 \frac{(n-1)S^2}{\sigma_0^2} σ02(n−1)S2 χ 2 ( n − 1 ) \chi^2(n-1) χ2(n−1) W = { U ≥ χ α / 2 2 ( n − 1 ) } ⋃ { U ≤ χ 1 − α / 2 2 ( n − 1 ) } W = \{U\geq \chi_{\alpha/2}^2(n-1)\} \bigcup \{U\leq \chi_{1-\alpha/2}^2(n-1)\} W={U≥χα/22(n−1)}⋃{U≤χ1−α/22(n−1)} (3)双正态总体 N ( μ 1 , σ 1 2 ) N(\mu_1,\sigma_1^2) N(μ1,σ12), N ( μ 2 , σ 2 2 ) N(\mu_2,\sigma_2^2) N(μ2,σ22)下的假设检验:
原假设 H 0 H_0 H0 备择假设 H 1 H_1 H1 条件 检验统计量U 近似分布 拒绝域W μ 1 = μ 2 \mu_1=\mu_2 μ1=μ2 μ 1 ≠ μ 2 \mu_1\neq\mu_2 μ1=μ2 σ 1 2 , σ 2 2 \sigma_1^2,\sigma_2^2 σ12,σ22已知 X ‾ − Y ‾ σ 1 2 n 1 + σ 2 2 n 2 \frac{\overline X-\overline Y}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} n1σ12+n2σ22X−Y N ( 0 , 1 ) N(0,1) N(0,1) W = { ∥ U ∥ ≥ z α / 2 } W = \{\|U\|\geq z_{\alpha/2}\} W={∥U∥≥zα/2} μ 1 = μ 2 \mu_1=\mu_2 μ1=μ2 μ 1 ≠ μ 2 \mu_1\neq\mu_2 μ1=μ2 σ 1 2 , σ 2 2 \sigma_1^2,\sigma_2^2 σ12,σ22未知但 σ 1 = σ 2 \sigma_1=\sigma_2 σ1=σ2 X ‾ − Y ‾ − ( μ 1 − μ 2 ) S w 1 n 1 + 1 n 2 \frac{\overline X-\overline Y-(\mu_1-\mu_2)}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} Swn11+n21X−Y−(μ1−μ2)
S w = ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 S_w=\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2} Sw=n1+n2−2(n1−1)S12+(n2−1)S22t ( n 1 + n 2 − 2 ) t(n_1+n_2-2) t(n1+n2−2) W = { ∥ U ∥ ≥ t α / 2 ( n 1 + n 2 − 2 ) } W = \{\|U\|\geq t_{\alpha/2}(n_1+n_2-2)\} W={∥U∥≥tα/2(n1+n2−2)} σ 1 2 = σ 2 2 \sigma_1^2 = \sigma_2^2 σ12=σ22 σ 1 2 ≠ σ 2 2 \sigma_1^2 \neq \sigma_2^2 σ12=σ22 μ 1 , μ 2 \mu_1,\mu_2 μ1,μ2已知 ∑ ( X 1 − μ 1 ) 2 / n 1 ∑ ( X 2 − μ 2 ) 2 / n 2 \frac{\sum(X_1-\mu_1)^2/n_1}{\sum(X_2-\mu_2)^2/n_2} ∑(X2−μ2)2/n2∑(X1−μ1)2/n1 F ( n 1 , n 2 ) F(n_1,n_2) F(n1,n2) W = { U ≥ F α / 2 2 ( n 1 , n 2 ) } ⋃ { U ≤ F 1 − α / 2 2 ( n 1 , n 2 ) } W = \{U\geq F_{\alpha/2}^2(n_1,n_2)\} \bigcup \{U\leq F_{1-\alpha/2}^2(n_1,n_2)\} W={U≥Fα/22(n1,n2)}⋃{U≤F1−α/22(n1,n2)} σ 1 2 = σ 2 2 \sigma_1^2 = \sigma_2^2 σ12=σ22 σ 1 2 ≠ σ 2 2 \sigma_1^2 \neq \sigma_2^2 σ12=σ22 μ 1 , μ 2 \mu_1,\mu_2 μ1,μ2未知 S 1 2 S 2 2 \frac{S_1^2}{S_2^2} S22S12 F ( n 1 − 1 , n 2 − 1 ) F(n_1-1,n_2-1) F(n1−1,n2−1) W = { U ≥ F α / 2 2 ( n 1 − 1 , n 2 − 1 ) } ⋃ { U ≤ F 1 − α / 2 2 ( n 1 − 1 , n 2 − 1 ) } W = \{U\geq F_{\alpha/2}^2(n_1-1,n_2-1)\} \bigcup \{U\leq F_{1-\alpha/2}^2(n_1-1,n_2-1)\} W={U≥Fα/22(n1−1,n2−1)}⋃{U≤F1−α/22(n1−1,n2−1)}