概率论考研笔记(四)

概率论考研笔记(四):数理统计

  • 数理统计相关概念和性质:
概念释义性质
总体研究对象的全体如果总体所包含的个体数量有限,称有限总体,反之称无限总体
个体总体中的每个成员
简单随机样本从总体中随机抽取的用于研究的个体,且符合:
代表性:样本能够代表总体,即样本中的每个分量与总体同分布
独立性:样本中的每个分量相互独立
简称样本
抽得样本的过程称为抽样
样本中个体的数量称为样本容量
对样本进行了若干次观测所得到的一组数据称为样本值
设总体X的分布函数为F(x)、概率密度为f(x),则样本 ( X 1 , X 2 , . . , X n ) (X_1,X_2,..,X_n) (X1,X2,..,Xn)的分布函数为: F ( x 1 , x 2 , . . , x n ) = ∏ F ( x i ) F(x_1,x_2,..,x_n) = \prod F(x_i) F(x1,x2,..,xn)=F(xi),概率密度为: f ( x 1 , x 2 , . . . , x n ) = ∏ f ( x i ) f(x_1,x_2,...,x_n) = \prod f(x_i) f(x1,x2,...,xn)=f(xi)
统计量 ( X 1 , X 2 , . . , X n ) (X_1,X_2,..,X_n) (X1,X2,..,Xn)为总体X的一个样本, T ( x 1 , x 2 , . . , x n ) T(x_1,x_2,..,x_n) T(x1,x2,..,xn)不含任何未知参数的函数,则称 T ( X 1 , X 2 , . . , X n ) T(X_1,X_2,..,X_n) T(X1,X2,..,Xn)为一个统计量统计量是样本的函数,且不含任何未知参数;
统计量的分布称为抽样分布
估计量/估计值设总体的分布为 F ( x ; θ ) F(x;\theta) F(x;θ),其中 θ = ( θ 1 , θ 2 , . . . , θ k ) \theta = (\theta_1,\theta_2,...,\theta_k) θ=(θ1,θ2,...,θk)未知参数组成的k维向量,若根据样本 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn构造一个统计量 θ ′ ( X 1 , X 2 , . . . , X n ) \theta'(X_1,X_2,...,X_n) θ(X1,X2,...,Xn)作为 θ \theta θ的估计,则称该统计量为 θ \theta θ估计量,代入样本值 x 1 , x 2 , . . . , x n x_1,x_2,...,x_n x1,x2,...,xn得到的具体值 θ ′ ( x 1 , x 2 , . . . , x n ) \theta'(x_1,x_2,...,x_n) θ(x1,x2,...,xn)称为 θ \theta θ估计值主要用于点估计中;
估计量的评价标准:
无偏性 E [ θ ′ ] = θ E[\theta'] = \theta E[θ]=θ,即估计量平均来看等于未知参数,无系统误差;
有效性:均方误差 E ( θ ′ − θ ) 2 E(\theta'-\theta)^2 E(θθ)2尽量小;
一致性/相合性 θ ′ → P θ \theta'\xrightarrow{P} \theta θP θ
置信区间 θ \theta θ是X的未知参数, X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn是其一个样本,若对事先给定的常数 α ( 0 < α < 1 ) \alpha(0<\alpha<1) α(0<α<1),存在两个统计量 θ 1 ′ ( X 1 , X 2 , . . . , X n ) \theta_1'(X_1,X_2,...,X_n) θ1(X1,X2,...,Xn) θ 2 ′ ( X 1 , X 2 , . . . , X n ) \theta_2'(X_1,X_2,...,X_n) θ2(X1,X2,...,Xn)使得 P ( θ 1 ′ < θ < θ 2 ′ ) = 1 − α P(\theta_1' < \theta < \theta_2') = 1 - \alpha P(θ1<θ<θ2)=1α,则称区间 ( θ 1 ′ , θ 2 ′ ) (\theta_1',\theta_2') (θ1,θ2) θ \theta θ置信度 1 − α 1- \alpha 1α置信下限 θ 1 ′ \theta_1' θ1置信上限 θ 2 ′ \theta_2' θ2的置信区间主要用于区间估计
参数估计当总体的分布类型已知但是其中某些参数未知时,利用样本构造合理的统计量对未知参数进行估计的过程称为参数估计参数估计分为点估计区间估计,前者直接给出未知参数的估计量/估计值;后者给出未知参数的置信区间
假设检验对总体的某些未知特征提出假设,并利用样本信息来推断该假设的正确性如果抽样检测出来的实际观测数据在假设的前提下发生的概率很小,根据小概率原理,可认为该假设很大概率上是错误的;
但是判断出错的可能性仍然是存在的,主要有两类错误:
拒真错误,即假设为真但是最终判定为拒绝假设;
取伪错误,即假设为假但是最终判定为接受假设;
两类错误相互矛盾,除了增加样本容量之外,没有方法可以同时减小两类错误,因此通常采用纽曼-皮尔逊准则
首先控制第一类错误的概率,再尽量减小第二类错误的概率
α \alpha α分位点设X为一个随机变量,对于给定的数 α ( 0 < α < 1 ) \alpha(0 < \alpha < 1) α(0<α<1),称满足条件 P ( X > λ α ) = α P(X > \lambda_{\alpha}) = \alpha P(X>λα)=α的实数 λ α \lambda_{\alpha} λα为X的上 α \alpha α分位点当X分别服从 N ( 0 , 1 ) N(0,1) N(0,1) χ 2 ( n ) \chi^2(n) χ2(n) t ( n ) t(n) t(n) F ( n 1 , n 2 ) F(n_1,n_2) F(n1,n2)时,其上 α \alpha α分位点分别记为 z α z_{\alpha} zα χ α 2 ( n ) \chi^2_{\alpha}(n) χα2(n) t α ( n ) t_{\alpha}(n) tα(n) F α ( n 1 , n 2 ) F_{\alpha}(n_1,n_2) Fα(n1,n2)

  • 大数定律:

    对于随机变量序列{ X n X_n Xn},若 1 n ∑ i = 1 n ( X i − E X i ) → P 0 \frac{1}{n}\sum_{i=1}^{n}(X_i-EX_i)\xrightarrow{P}0 n1i=1n(XiEXi)P 0,则称 { X n } \{X_n\} {Xn}服从大数定律,常用的大数定律如下:

    (1)切比雪夫大数定律:若 { X n } \{X_n\} {Xn}两两不相关的随机变量序列,且存在常数 C C C使得对于任意随机变量 X i X_i Xi,有 D ( X i ) ≤ C D(X_i)\leq C D(Xi)C,则 { X n } \{X_n\} {Xn}服从大数定律;

    (2)辛钦大数定律:若 { X n } \{X_n\} {Xn}为一列独立同分布的随机变量,设 E X n = μ , D X n = σ 2 < ∞ EX_n=\mu,DX_n = \sigma^2<\infty EXn=μ,DXn=σ2<,则: 1 n ∑ i = 1 n X i → P μ \frac{1}{n}\sum_{i=1}^{n}X_i\xrightarrow{P}\mu n1i=1nXiP μ,即样本均值依概率收敛到总体均值(可推广到k阶距)

    (3)伯努利大数定律:设 n A n_A nAn重伯努利试验中事件A发生的频数,p为其每次试验发生的概率,则 n A n → P p \frac{n_A}{n}\xrightarrow{P}p nnAP p,即事件A发生的频率依概率收敛到A发生的概率


  • 中心极限定理:

    对于相互独立的随机变量序列{ X n X_n Xn},若其标准化随机变量: X ∗ = ∑ ( X i − E X i ) D X i X^* = \sum\frac{(X_i-EX_i)}{\sqrt{ DX_i}} X=DXi (XiEXi)对于任意实数x,均有: lim ⁡ n → ∞ F X ∗ ( x ) = Φ ( x ) \lim\limits_{n\rightarrow \infty} F_{X^*}(x) = \Phi(x) nlimFX(x)=Φ(x),则称 { X n } \{X_n\} {Xn}服从中心极限定理,常用的中心极限定理如下:

    (1)列维-林德伯格中心极限定理:若 { X n } \{X_n\} {Xn}为一列独立同分布的随机变量,设 E X n = μ , D X n = σ 2 < ∞ EX_n=\mu,DX_n = \sigma^2<\infty EXn=μ,DXn=σ2<,则 { X n } \{X_n\} {Xn}服从中心极限定理,即: ∑ X i \sum X_i Xi近似服从 N ( n μ , n σ 2 ) N(n\mu,n\sigma^2) N(nμ,nσ2)

    (2)棣莫弗-拉普拉斯中心极限定理:若随机变量 X n X_n Xn服从二项分布 B ( n , p ) B(n,p) B(n,p),则两点分布列 { X n } \{X_n\} {Xn}服从中心极限定理,即 X n X_n Xn近似服从 N ( n p , n p ( 1 − p ) ) N(np,np(1-p)) N(np,np(1p))

    (3)林德伯格-费勒中心极限定理:若{ X n X_n Xn}是独立的随机变量序列,设 B n = ∑ σ i 2 B_n = \sum \sigma_i^2 Bn=σi2,则若对任何 ϵ > 0 \epsilon >0 ϵ>0,都有:
    lim ⁡ n → ∞ 1 B n 2 ∑ E [ ( X i − E X i ) 2 ∗ I { a b s ( X i − E X i ) > ϵ ∗ B n } ] = 0 \lim_{n\rightarrow \infty}\frac{1}{B_n^2}\sum E[(X_i-EX_i)^2*I_{\{abs(X_i-EX_i)>\epsilon*B_n\}}] = 0 limnBn21E[(XiEXi)2I{abs(XiEXi)>ϵBn}]=0
    { X n } \{X_n\} {Xn}服从中心极限定理;


  • 常用矩统计量:
矩统计量表达式性质
样本均值 X ‾ \overline X X X ‾ = 1 n ∑ i = 1 n X i \overline X = \frac{1}{n}\sum_{i=1}^n X_i X=n1i=1nXi若总体X的期望为 μ \mu μ,方差为 σ 2 \sigma^2 σ2,则根据列维-林德伯格中心极限定理,样本均值 X ‾ \overline X X近似服从 N ( μ , σ 2 n ) N(\mu,\frac{\sigma^2}{n}) N(μ,nσ2);
E ( X ‾ ) = μ , D ( X ‾ ) = σ 2 n E(\overline X) =\mu,D(\overline X)=\frac{\sigma^2}{n} E(X)=μ,D(X)=nσ2
样本方差 S 2 S^2 S2 S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ‾ ) 2 S^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \overline X)^2 S2=n11i=1n(XiX)2 E ( S 2 ) = σ 2 , D ( S 2 ) = 2 σ 4 n − 1 E(S^2)=\sigma^2,D(S^2)=\frac{2\sigma^4}{n-1} E(S2)=σ2,D(S2)=n12σ4;
S称为样本标准差;
X ‾ \overline X X S 2 S^2 S2相互独立;
X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn来自正态总体 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)的样本,则:
X ‾ ~ N ( μ , σ 2 n ) \overline X ~ N(\mu,\frac{\sigma^2}{n}) XN(μ,nσ2)
( n − 1 ) S 2 σ 2 = ∑ ( X i − X ‾ ) 2 σ 2 ~ χ 2 ( n − 1 ) \cfrac{(n-1)S^2}{\sigma^2} = \cfrac{\sum(X_i-\overline X)^2}{\sigma^2}~\chi^2(n-1) σ2(n1)S2=σ2(XiX)2χ2(n1)
X ‾ − μ S n ~ t ( n − 1 ) \cfrac{\overline X - \mu}{\frac{S}{\sqrt{n}}}~t(n-1) n SXμt(n1);
∑ ( X i − μ ) 2 σ 2 ~ χ 2 ( n ) \cfrac{\sum(X_i-\mu)^2}{\sigma^2}~\chi^2(n) σ2(Xiμ)2χ2(n)
样本k阶原点矩 A k A_k Ak A k = 1 n ∑ i = 1 n X i k A_k = \frac{1}{n} \sum_{i=1}^n X_i^k Ak=n1i=1nXik样本均值即为样本1阶原点矩
样本k阶中心距 B k B_k Bk B k = 1 n ∑ i = 1 n ( X i − X ‾ ) k B_k = \frac{1}{n} \sum_{i=1}^n (X_i-\overline X)^k Bk=n1i=1n(XiX)k样本方差不是样本2阶中心距;
样本二阶中心矩又记作 S ∗ 2 S^{*2} S2

  • 正态总体下常见统计量的抽样分布:
分布名称参数概率密度期望方差模型 / 性质
χ 2 \chi^2 χ2分布 n n n f ( x ) = { exp ⁡ ( − x 2 ) x n 2 − 1 2 n 2 Γ ( n 2 ) x > 0 0 x ≤ 0 f(x)=\begin{cases}\cfrac{\exp(\frac{-x}{2})x^{\frac{n}{2}-1}}{2^\frac{n}{2}\Gamma(\frac{n}{2})}&x>0\\0&x\le0 \end{cases} f(x)=22nΓ(2n)exp(2x)x2n10x>0x0 n n n 2 n 2n 2n X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn相互独立的随机变量,且均服从标准正态分布,则称随机变量 χ 2 = ∑ X i 2 \chi^2 = \sum X_i^2 χ2=Xi2服从自由度为n的 χ 2 \chi^2 χ2分布,记为 χ 2 ~ χ 2 ( n ) \chi^2 ~ \chi^2(n) χ2χ2(n)
①若 χ 1 2 ~ χ 2 ( n 1 ) , χ 2 2 ~ χ 2 ( n 2 ) \chi_1^2 ~ \chi^2(n_1),\chi_2^2 ~ \chi^2(n_2) χ12χ2(n1),χ22χ2(n2),且相互独立,则 χ 1 2 + χ 2 2 ~ χ 2 ( n 1 + n 2 ) \chi_1^2+\chi_2^2 ~ \chi^2(n_1+n_2) χ12+χ22χ2(n1+n2)
②当n很大时(一般大于40), χ α 2 ( n ) ≈ 1 2 ( u α + 2 n − 1 ) 2 \chi_{\alpha}^2(n) \approx \frac{1}{2}(u_{\alpha}+\sqrt{2n-1})^2 χα2(n)21(uα+2n1 )2
t t t分布 n n n f ( x ) = { Γ ( n + 1 2 ) n π Γ ( n 2 ) ( 1 + x 2 n ) − n + 1 2 f(x) = \begin{cases}\cfrac{\Gamma(\frac{n+1}{2})}{\sqrt{n\pi}\Gamma(\frac{n}{2})}(1+\frac{x^2}{n})^{-\frac{n+1}{2}} \end{cases} f(x)={nπ Γ(2n)Γ(2n+1)(1+nx2)2n+1 0 0 0 n n − 2 \frac{n}{n-2} n2n
( n > 2 ) (n > 2) (n>2)
X ~ N ( 0 , 1 ) X~N(0,1) XN(0,1) Y ~ χ 2 ( n ) Y~\chi^2(n) Yχ2(n),且X与Y相互独立,则称随机变量 T = X Y n T = \frac{X}{\sqrt{\frac{Y}{n}}} T=nY X服从自由度为n的t分布,记为 T ~ t ( n ) T~t(n) Tt(n)
①f(x)是偶函数;
②当 n → ∞ n \rightarrow \infty n时, t ( n ) → N ( 0 , 1 ) t(n)\rightarrow N(0,1) t(n)N(0,1)
③当n较小时,t分布与标准正态分布差别较大;
④当n=1时, f ( x ) = 1 π ( 1 + x 2 ) f(x) = \frac{1}{\pi (1+x^2)} f(x)=π(1+x2)1,即 t ( 1 ) t(1) t(1)柯西分布
⑤当n较大时(一般大于45), t α ( n ) ≈ u α t_{\alpha}(n) \approx u_{\alpha} tα(n)uα
t α ( n ) = − t 1 − α ( n ) t_{\alpha}(n) = -t_{1-\alpha}(n) tα(n)=t1α(n)
F F F分布 n 1 , n 2 n_1,n_2 n1,n2 f ( x ) = { Γ ( n 1 + n 2 2 ) Γ ( n 1 2 ) Γ ( n 2 2 ) ( n 1 n 2 ) n 1 2 x n 1 2 − 1 ( 1 + n 1 n 2 x ) − n 1 + n 2 2 x > 0 0 x ≤ 0 f(x) = \begin{cases}\cfrac{\Gamma(\frac{n_1+n_2}{2})}{\Gamma(\frac{n_1}{2})\Gamma(\frac{n_2}{2})}(\frac{n_1}{n_2})^{\frac{n_1}{2}}x^{\frac{n_1}{2}-1}(1+\frac{n_1}{n_2}x)^{-\frac{n_1+n_2}{2}} &x>0\\0&x\le0\end{cases} f(x)=Γ(2n1)Γ(2n2)Γ(2n1+n2)(n2n1)2n1x2n11(1+n2n1x)2n1+n20x>0x0 n 2 n 2 − 2 \cfrac{n_2}{n_2-2} n22n2 2 n 2 2 ( n 1 + n 2 − 2 ) n 1 ( n 2 − 2 ) 2 ( n 2 − 2 ) \cfrac{2n_2^2(n_1+n_2-2)}{n_1(n_2-2)^2(n_2-2)} n1(n22)2(n22)2n22(n1+n22) U ~ χ 2 ( n 1 ) U~\chi^2(n_1) Uχ2(n1) V ~ χ 2 ( n 2 ) V~\chi^2(n_2) Vχ2(n2)且U和V相互独立,则称随机变量 F = U / n 1 V / n 2 F = \frac{U/n_1}{V/n_2} F=V/n2U/n1服从自由度为(n1,n2)的F分布,记为 F ~ F ( n 1 , n 2 ) F~F(n_1,n_2) FF(n1,n2)
①若 F ~ F ( n 1 , n 2 ) F~F(n_1,n_2) FF(n1,n2),则 1 F ~ F ( n 2 , n 1 ) \frac{1}{F}~F(n_2,n_1) F1F(n2,n1)
②若 T ~ t ( n ) T~t(n) Tt(n),则 T 2 ~ F ( 1 , n ) T^2~F(1,n) T2F(1,n)
F 1 − α ( n 1 , n 2 ) = 1 F α ( n 2 , n 1 ) F_{1-\alpha}(n_1,n_2) = \frac{1}{F_{\alpha}(n_2,n_1)} F1α(n1,n2)=Fα(n2,n1)1

  • 点估计:

    (1)矩估计法:用样本矩代替总体距进行点估计(依据大数定律)

    步骤操作公式
    1根据总体分布 F ( x ; θ ) F(x;\theta) F(x;θ)求总体的1~k阶原点矩 μ i \mu_i μi μ i = g i ( θ 1 , θ 2 , . . . , θ k ) \mu_i = g_i(\theta_1,\theta_2,...,\theta_k) μi=gi(θ1,θ2,...,θk)
    2解步骤1中的线性方程得到 θ i \theta_i θi的表达式 θ i = h i ( μ 1 , μ 2 , . . . , μ k ) \theta_i = h_i(\mu_1,\mu_2,...,\mu_k) θi=hi(μ1,μ2,...,μk)
    3用样本距 A i A_i Ai代替步骤2中的总体距 μ i \mu_i μi,即得矩估计 θ i ′ = h i ( A 1 , A 2 , . . . , A k ) \theta_i' = h_i(A_1,A_2,...,A_k) θi=hi(A1,A2,...,Ak)

    (2)最大似然估计法:根据已有样本值,选择未知参数的一个合理的估计值,使得参数在选取该估计值时样本得到该批样本值的可能性达到最大

    步骤操作公式
    1根据总体分布的概率密度 f ( x ; θ ) f(x;\theta) f(x;θ)得到样本 X 1 , X 2 , . . , X n X_1,X_2,..,X_n X1,X2,..,Xn的联合密度/似然函数 L L L或联合密度的对数/对数似然函数 ln ⁡ L \ln L lnL L ( x 1 , , , x n ; θ ) = ∏ f ( x i ; θ ) L(x_1,,,x_n;\theta) = \prod f(x_i;\theta) L(x1,,,xn;θ)=f(xi;θ)
    ln ⁡ L ( x 1 , , , x n ; θ ) = ∑ ln ⁡ f ( x i ; θ ) \ln L(x_1,,,x_n;\theta) = \sum \ln f(x_i;\theta) lnL(x1,,,xn;θ)=lnf(xi;θ)
    2将步骤1得到的似然函数/对数似然函数对 θ \theta θ求导,得到似然方程(组) d d θ L ( x 1 , . . , x n ; θ ) = 0 \frac{d}{d \theta}L(x_1,..,x_n;\theta) = 0 dθdL(x1,..,xn;θ)=0
    d d θ ln ⁡ L ( x 1 , . . , x n ; θ ) = 0 \frac{d}{d \theta}\ln L(x_1,..,x_n;\theta) = 0 dθdlnL(x1,..,xn;θ)=0
    3解步骤2中得到的似然方程(组),得到 θ \theta θ极大似然估计值,再进一步判断可得到最大似然估计值 θ ′ = θ 0 \theta' = \theta_0 θ=θ0,其中 L ( x 1 , . . , x n ; θ 0 ) = L m a x ( x 1 , . . , x n ; θ ) L(x_1,..,x_n;\theta_0) = L_{max}(x_1,..,x_n;\theta) L(x1,..,xn;θ0)=Lmax(x1,..,xn;θ)

  • 区间估计:

    (1)枢轴变量法通用步骤:

    步骤操作公式
    1找到一个样本函数 U ( X 1 , X 2 , . . , X n ; θ ) U(X_1,X_2,..,X_n;\theta) U(X1,X2,..,Xn;θ),而 U U U的分布已知且不依赖任何未知参数,称该 U U U枢轴变量例如:令 U U U为标准化正态样本均值 X ‾ − μ σ / n ~ N ( 0 , 1 ) \frac{\overline X-\mu}{\sigma / \sqrt{n}}~N(0,1) σ/n XμN(0,1)
    2对给定的置信度 1 − α 1-\alpha 1α,根据U的分布找到两个常数a,b,使得: P ( a < U < b ) = 1 − α P(a<U<b) = 1-\alpha P(a<U<b)=1α承接步骤1例: P ( − u α / 2 < X ‾ − μ σ / n < u α / 2 ) = 1 − α P(-u_{\alpha/2}<\frac{\overline X-\mu}{\sigma / \sqrt{n}}<u_{\alpha/2}) = 1-\alpha P(uα/2<σ/n Xμ<uα/2)=1α
    3解步骤2括号中不等式,得到置信区间 ( θ 1 ′ , θ 2 ′ ) (\theta_1',\theta_2') (θ1,θ2)承接步骤2中例: − u α / 2 < X ‾ − μ σ / n < u α / 2 ⇒ μ 1 ′ < μ < μ 2 ′ ⇒ ( μ 1 ′ , μ 2 ′ ) -u_{\alpha/2}<\frac{\overline X-\mu}{\sigma / \sqrt{n}}<u_{\alpha/2} \Rightarrow \mu_1' < \mu < \mu_2' \Rightarrow (\mu_1',\mu_2') uα/2<σ/n Xμ<uα/2μ1<μ<μ2(μ1,μ2)

    (2)单正态总体 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)下的区间估计:

    未知参数条件枢轴变量U近似分布
    μ \mu μ σ 2 \sigma^2 σ2已知 X ‾ − μ σ / n \frac{\overline X-\mu}{\sigma / \sqrt{n}} σ/n Xμ N ( 0 , 1 ) N(0,1) N(0,1)
    μ \mu μ σ 2 \sigma^2 σ2未知 X ‾ − μ S / n \frac{\overline X-\mu}{S / \sqrt{n}} S/n Xμ t ( n − 1 ) t(n-1) t(n1)
    σ 2 \sigma^2 σ2 μ \mu μ已知 Σ ( X − μ ) 2 σ 2 \frac{\Sigma( X-\mu)^2}{\sigma^2} σ2Σ(Xμ)2 χ 2 ( n ) \chi^2(n) χ2(n)
    σ 2 \sigma^2 σ2 μ \mu μ未知 ( n − 1 ) S 2 σ 2 \frac{(n-1)S^2}{\sigma^2} σ2(n1)S2 χ 2 ( n − 1 ) \chi^2(n-1) χ2(n1)

    (3)双正态总体 N ( μ 1 , σ 1 2 ) N(\mu_1,\sigma_1^2) N(μ1,σ12), N ( μ 2 , σ 2 2 ) N(\mu_2,\sigma_2^2) N(μ2,σ22)下的区间估计:

    未知参数条件枢轴变量U近似分布
    μ 1 − μ 2 \mu_1-\mu_2 μ1μ2 σ 1 2 , σ 2 2 \sigma_1^2,\sigma_2^2 σ12,σ22已知 X ‾ − Y ‾ − ( μ 1 − μ 2 ) σ 1 2 n 1 + σ 2 2 n 2 \frac{\overline X-\overline Y-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} n1σ12+n2σ22 XY(μ1μ2) N ( 0 , 1 ) N(0,1) N(0,1)
    μ 1 − μ 2 \mu_1-\mu_2 μ1μ2 σ 1 2 , σ 2 2 \sigma_1^2,\sigma_2^2 σ12,σ22未知但 σ 1 = σ 2 \sigma_1=\sigma_2 σ1=σ2 X ‾ − Y ‾ − ( μ 1 − μ 2 ) S w 1 n 1 + 1 n 2 \frac{\overline X-\overline Y-(\mu_1-\mu_2)}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} Swn11+n21 XY(μ1μ2)
    S w = ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 S_w=\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2} Sw=n1+n22(n11)S12+(n21)S22
    t ( n 1 + n 2 − 2 ) t(n_1+n_2-2) t(n1+n22)
    σ 1 2 / σ 2 2 \sigma_1^2/\sigma_2^2 σ12/σ22 μ 1 , μ 2 \mu_1,\mu_2 μ1,μ2已知 ∑ ( X 1 − μ 1 ) 2 / n 1 ∑ ( X 2 − μ 2 ) 2 / n 2 \frac{\sum(X_1-\mu_1)^2/n_1}{\sum(X_2-\mu_2)^2/n_2} (X2μ2)2/n2(X1μ1)2/n1 F ( n 1 , n 2 ) F(n_1,n_2) F(n1,n2)
    σ 1 2 / σ 2 2 \sigma_1^2/\sigma_2^2 σ12/σ22 μ 1 , μ 2 \mu_1,\mu_2 μ1,μ2未知 S 1 2 / S 2 2 σ 1 2 / σ 2 2 \frac{S_1^2/S_2^2}{\sigma_1^2/\sigma_2^2} σ12/σ22S12/S22 F ( n 1 − 1 , n 2 − 1 ) F(n_1-1,n_2-1) F(n11,n21)

  • 假设检验:

    (1)通用步骤:

    步骤操作
    ①提出假设原假设,即需要检验的假设,记为 H 0 H_0 H0
    备择假设:在拒绝 H 0 H_0 H0后可供选择的一个假设,记为 H 1 H_1 H1
    ②构造检验统计量 U U U构造一个合适的统计量(通常取原假设中未知参数的优良的估计量)
    ③定义显著性水平 α \alpha α即一个小概率值 α \alpha α,描述在 H 0 H_0 H0成立的条件下 H 0 H_0 H0被拒绝的概率
    ④确定拒绝域 W W W即使得 H 0 H_0 H0被拒绝的样本观测值的集合W,再利用关系式 P ( U ∈ W ∥ H 0 ) ≤ α P(U \in W \| H_0) \leq \alpha P(UWH0)α解得拒绝域中U的取值范围
    ⑤抽样检测由样本算出检验统计量的观测值U‘,若U’落在拒绝域W中,则拒绝 H 0 H_0 H0;否则则接受 H 0 H_0 H0

    (以下仅考虑双边检验 H 1 H_1 H1 H 0 H_0 H0两侧),单边检验 H 1 H_1 H1 H 0 H_0 H0各居一侧)可类比)

    (2)单正态总体 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)下的假设检验:

    原假设 H 0 H_0 H0备择假设 H 1 H_1 H1条件检验统计量U近似分布拒绝域W
    μ = μ 0 \mu = \mu_0 μ=μ0 μ ≠ μ 0 \mu \neq \mu_0 μ=μ0 σ 2 \sigma^2 σ2已知 X ‾ − μ 0 σ / n \frac{\overline X-\mu_0}{\sigma / \sqrt{n}} σ/n Xμ0 N ( 0 , 1 ) N(0,1) N(0,1) W = { ∥ U ∥ ≥ z α / 2 } W = \{\|U\|\geq z_{\alpha/2}\} W={Uzα/2}
    μ = μ 0 \mu = \mu_0 μ=μ0 μ ≠ μ 0 \mu \neq \mu_0 μ=μ0 σ 2 \sigma^2 σ2未知 X ‾ − μ 0 S / n \frac{\overline X-\mu_0}{S / \sqrt{n}} S/n Xμ0 t ( n − 1 ) t(n-1) t(n1) W = { ∥ U ∥ ≥ t α / 2 ( n − 1 ) } W = \{\|U\|\geq t_{\alpha/2}(n-1)\} W={Utα/2(n1)}
    σ 2 = σ 0 2 \sigma^2 = \sigma_0^2 σ2=σ02 σ 2 ≠ σ 0 2 \sigma^2 \neq \sigma_0^2 σ2=σ02 μ \mu μ已知 Σ ( X − μ ) 2 σ 0 2 \frac{\Sigma( X-\mu)^2}{\sigma_0^2} σ02Σ(Xμ)2 χ 2 ( n ) \chi^2(n) χ2(n) W = { U ≥ χ α / 2 2 ( n ) } ⋃ { U ≤ χ 1 − α / 2 2 ( n ) } W = \{U\geq \chi_{\alpha/2}^2(n)\} \bigcup \{U\leq \chi_{1-\alpha/2}^2(n)\} W={Uχα/22(n)}{Uχ1α/22(n)}
    σ 2 = σ 0 2 \sigma^2 = \sigma_0^2 σ2=σ02 σ 2 ≠ σ 0 2 \sigma^2 \neq \sigma_0^2 σ2=σ02 μ \mu μ未知 ( n − 1 ) S 2 σ 0 2 \frac{(n-1)S^2}{\sigma_0^2} σ02(n1)S2 χ 2 ( n − 1 ) \chi^2(n-1) χ2(n1) W = { U ≥ χ α / 2 2 ( n − 1 ) } ⋃ { U ≤ χ 1 − α / 2 2 ( n − 1 ) } W = \{U\geq \chi_{\alpha/2}^2(n-1)\} \bigcup \{U\leq \chi_{1-\alpha/2}^2(n-1)\} W={Uχα/22(n1)}{Uχ1α/22(n1)}

    (3)双正态总体 N ( μ 1 , σ 1 2 ) N(\mu_1,\sigma_1^2) N(μ1,σ12), N ( μ 2 , σ 2 2 ) N(\mu_2,\sigma_2^2) N(μ2,σ22)下的假设检验:

    原假设 H 0 H_0 H0备择假设 H 1 H_1 H1条件检验统计量U近似分布拒绝域W
    μ 1 = μ 2 \mu_1=\mu_2 μ1=μ2 μ 1 ≠ μ 2 \mu_1\neq\mu_2 μ1=μ2 σ 1 2 , σ 2 2 \sigma_1^2,\sigma_2^2 σ12,σ22已知 X ‾ − Y ‾ σ 1 2 n 1 + σ 2 2 n 2 \frac{\overline X-\overline Y}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} n1σ12+n2σ22 XY N ( 0 , 1 ) N(0,1) N(0,1) W = { ∥ U ∥ ≥ z α / 2 } W = \{\|U\|\geq z_{\alpha/2}\} W={Uzα/2}
    μ 1 = μ 2 \mu_1=\mu_2 μ1=μ2 μ 1 ≠ μ 2 \mu_1\neq\mu_2 μ1=μ2 σ 1 2 , σ 2 2 \sigma_1^2,\sigma_2^2 σ12,σ22未知但 σ 1 = σ 2 \sigma_1=\sigma_2 σ1=σ2 X ‾ − Y ‾ − ( μ 1 − μ 2 ) S w 1 n 1 + 1 n 2 \frac{\overline X-\overline Y-(\mu_1-\mu_2)}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} Swn11+n21 XY(μ1μ2)
    S w = ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 S_w=\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2} Sw=n1+n22(n11)S12+(n21)S22
    t ( n 1 + n 2 − 2 ) t(n_1+n_2-2) t(n1+n22) W = { ∥ U ∥ ≥ t α / 2 ( n 1 + n 2 − 2 ) } W = \{\|U\|\geq t_{\alpha/2}(n_1+n_2-2)\} W={Utα/2(n1+n22)}
    σ 1 2 = σ 2 2 \sigma_1^2 = \sigma_2^2 σ12=σ22 σ 1 2 ≠ σ 2 2 \sigma_1^2 \neq \sigma_2^2 σ12=σ22 μ 1 , μ 2 \mu_1,\mu_2 μ1,μ2已知 ∑ ( X 1 − μ 1 ) 2 / n 1 ∑ ( X 2 − μ 2 ) 2 / n 2 \frac{\sum(X_1-\mu_1)^2/n_1}{\sum(X_2-\mu_2)^2/n_2} (X2μ2)2/n2(X1μ1)2/n1 F ( n 1 , n 2 ) F(n_1,n_2) F(n1,n2) W = { U ≥ F α / 2 2 ( n 1 , n 2 ) } ⋃ { U ≤ F 1 − α / 2 2 ( n 1 , n 2 ) } W = \{U\geq F_{\alpha/2}^2(n_1,n_2)\} \bigcup \{U\leq F_{1-\alpha/2}^2(n_1,n_2)\} W={UFα/22(n1,n2)}{UF1α/22(n1,n2)}
    σ 1 2 = σ 2 2 \sigma_1^2 = \sigma_2^2 σ12=σ22 σ 1 2 ≠ σ 2 2 \sigma_1^2 \neq \sigma_2^2 σ12=σ22 μ 1 , μ 2 \mu_1,\mu_2 μ1,μ2未知 S 1 2 S 2 2 \frac{S_1^2}{S_2^2} S22S12 F ( n 1 − 1 , n 2 − 1 ) F(n_1-1,n_2-1) F(n11,n21) W = { U ≥ F α / 2 2 ( n 1 − 1 , n 2 − 1 ) } ⋃ { U ≤ F 1 − α / 2 2 ( n 1 − 1 , n 2 − 1 ) } W = \{U\geq F_{\alpha/2}^2(n_1-1,n_2-1)\} \bigcup \{U\leq F_{1-\alpha/2}^2(n_1-1,n_2-1)\} W={UFα/22(n11,n21)}{UF1α/22(n11,n21)}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值