参数估计
一、点估计
总体X的分布函数F(x;θ)F(x;\theta)F(x;θ)形式已知,但它的一个或多个参数θ\thetaθ未知,借助于总体X的一个样本X1, X2, …, Xn ,x1, x2, …, xn 是相应的样本值,构造适当的统计量θ^(X1,X2,...,Xn)\hat{\theta}(X_1,X_2,...,X_n)θ^(X1,X2,...,Xn),观察值θ^(x1,x2,...,xn)\hat{\theta}(x_1,x_2,...,x_n)θ^(x1,x2,...,xn)作为未知参数θ\thetaθ的近似值。θ^(X1,X2,...,Xn)\hat{\theta}(X_1,X_2,...,X_n)θ^(X1,X2,...,Xn)称为估计量,θ^(x1,x2,...,xn)\hat{\theta}(x_1,x_2,...,x_n)θ^(x1,x2,...,xn)称为估计值。
(一)矩估计法
假设总体X的前k阶矩μl=E(Xl)\mu_l=E(X^l)μl=E(Xl)存在,样本矩Al=1n∑i=1nXilA_l=\dfrac{1}{n}\sum\limits_{i=1}^{n}X_i^lAl=n1i=1∑nXil依概率收敛于相应的总体矩μl(l=1,2,...,k)\mu_l(l=1,2,...,k)μl(l=1,2,...,k),设
{μ1=μ1(θ1,θ2,...,θk),μ2=μ2(θ2,θ2,...,θk),⋮μk=μ2(θ2,θ2,...,θk)\begin{cases}
\mu_1=\mu_1(\theta_1,\theta_2,...,\theta_k),\\
\mu_2=\mu_2(\theta_2,\theta_2,...,\theta_k),\\
\vdots\\
\mu_k=\mu_2(\theta_2,\theta_2,...,\theta_k)\\
\end{cases}⎩⎪⎪⎪⎪⎨⎪⎪⎪⎪⎧μ1=μ1(θ1,θ2,...,θk),μ2=μ2(θ2,θ2,...,θk),⋮μk=μ2(θ2,θ2,...,θk)
是一个包含k个未知参数θ1,θ2,...,θk\theta_1,\theta_2,...,\theta_kθ1,θ2,...,θk的联立方程,一般可以从中解出θ1,θ2,...,θk\theta_1,\theta_2,...,\theta_kθ1,θ2,...,θk,得到
{θ1=θ1(μ1,μ2,...,μk),θ2=θ2(μ1,μ2,...,μk),⋮θk=θk(μ1,μ2,...,μk)\begin{cases}
\theta_1=\theta_1(\mu_1,\mu_2,...,\mu_k),\\
\theta_2=\theta_2(\mu_1,\mu_2,...,\mu_k),\\
\vdots\\
\theta_k=\theta_k(\mu_1,\mu_2,...,\mu_k)\\
\end{cases}⎩⎪⎪⎪⎪⎨⎪⎪⎪⎪⎧θ1=θ1(μ1,μ2,...,μk),θ2=θ2(μ1,μ2,...,μk),⋮θk=θk(μ1,μ2,...,μk)
以样本矩AiA_iAi代替上式μi,i=1,2,...,k\mu_i,i=1,2,...,kμi,i=1,2,...,k,就以θi^=θi(A1,A2,...,Ak),i=1,2,...,k\hat{\theta_i}=\theta_i(A_1,A_2,...,A_k),i=1,2,...,kθi^=θi(A1,A2,...,Ak),i=1,2,...,k分别作为θi,i=1,2,...,k\theta_i,i=1,2,...,kθi,i=1,2,...,k的估计量,这种估计量称为矩估计量。
(二)最大似然估计法
(1)离散型变量X
设总体X的分布律P{X=x}=p(x;θ),θ∈ΘP\{X=x\}=p(x;\theta), \theta\in\ThetaP{X=x}=p(x;θ),θ∈Θ,θ\thetaθ是待估参数,Θ\ThetaΘ是θ\thetaθ可能取值的范围。样本X1, X2, …, Xn 的联合分布律为∏i=1np(xi;θ)\prod\limits_{i=1}^{n}p(x_i;\theta)i=1∏np(xi;θ),x1, x2, …, xn 是相应于X1, X2, …, Xn 的样本值,事件{X1=x1,X2=x2,...,Xn=xn}\{X_1=x_1,X_2=x_2,...,X_n=x_n\}{X1=x1,X2=x2,...,Xn=xn}发生的概率为
L(θ)=L(x1,x2,...,xn;θ)=∏i=1np(xi;θ),θ∈ΘL(\theta)=L(x_1,x_2,...,x_n;\theta)=\prod\limits_{i=1}^{n}p(x_i;\theta), \theta\in\ThetaL(θ)=L(x1,x2,...,xn;θ)=i=1∏np(xi;θ),θ∈Θ
称为样本的似然函数。
固定样本观察值x1, x2, …, xn ,在θ\thetaθ可能取值的范围Θ\ThetaΘ内挑选使似然函数达到最大值的参数值θ^\hat{\theta}θ^,作为参数θ\thetaθ的估计值,即
L(x1,x2,...,xn;θ^)=maxθ∈ΘL(x1,x2,...,xn;θ)L(x_1,x_2,...,x_n;\hat{\theta})=\max\limits_{\theta\in\Theta} L(x_1,x_2,...,x_n;\theta)L(x1,x2,...,xn;θ^)=θ∈ΘmaxL(x1,x2,...,xn;θ)
这样的θ^\hat{\theta}θ^与样本值x1, x2, …, xn 有关,常记为θ^(x1,x2,...,xn)\hat{\theta}(x_1,x_2,...,x_n)θ^(x1,x2,...,xn),称为参数θ\thetaθ的最大似然估计值,相应的θ^(X1,X2,...,Xn)\hat{\theta}(X_1,X_2,...,X_n)θ^(X1,X2,...,Xn)为参数θ\thetaθ的最大似然估计量。
(2)连续型变量X
设总体X的概率密度f(x;θ),θ∈Θf(x;\theta), \theta\in\Thetaf(x;θ),θ∈Θ,θ\thetaθ是待估参数,Θ\ThetaΘ是θ\thetaθ可能取值的范围。样本X1, X2, …, Xn 的联合密度为∏i=1nf(xi;θ)\prod\limits_{i=1}^{n}f(x_i;\theta)i=1∏nf(xi;θ),x1, x2, …, xn 是相应于X1, X2, …, Xn 的样本值,则随机点(X1, X2, …, Xn)落在点(x1, x2, …, xn)的邻域内的概率近似为∏i=1nf(xi;θ)dxi\prod\limits_{i=1}^{n}f(x_i;\theta)dx_ii=1∏nf(xi;θ)dxi,取θ\thetaθ的估计值θ^\hat{\theta}θ^使概率∏i=1nf(xi;θ)dxi\prod\limits_{i=1}^{n}f(x_i;\theta)dx_ii=1∏nf(xi;θ)dxi最大,因子∏i=1ndxi\prod\limits_{i=1}^{n}dx_ii=1∏ndxi不随θ\thetaθ而变,故只需考虑函数
L(θ)=L(x1,x2,...,xn;θ)=∏i=1nf(xi;θ)L(\theta)=L(x_1,x_2,...,x_n;\theta)=\prod\limits_{i=1}^{n}f(x_i;\theta)L(θ)=L(x1,x2,...,xn;θ)=i=1∏nf(xi;θ)
的最大值,上式称为样本的似然函数。若
L(x1,x2,...,xn;θ^)=maxθ∈ΘL(x1,x2,...,xn;θ)L(x_1,x_2,...,x_n;\hat{\theta})=\max\limits_{\theta\in\Theta} L(x_1,x_2,...,x_n;\theta)L(x1,x2,...,xn;θ^)=θ∈ΘmaxL(x1,x2,...,xn;θ)
则称θ^(x1,x2,...,xn)\hat{\theta}(x_1,x_2,...,x_n)θ^(x1,x2,...,xn)为θ\thetaθ的最大似然估计值,相应的θ^(X1,X2,...,Xn)\hat{\theta}(X_1,X_2,...,X_n)θ^(X1,X2,...,Xn)为参数θ\thetaθ的最大似然估计量。
通常,通过对对数似然求导来求解参数,即解方程ddθlnL(θ)=0\dfrac{d}{d\theta}\ln L(\theta)=0dθdlnL(θ)=0.
当有多个未知参数时,解对数似然方程组∂∂θilnL=0,i=1,2,...,k\dfrac{\partial}{\partial\theta_i}\ln L=0,i=1,2,...,k∂θi∂lnL=0,i=1,2,...,k.
二、估计量的评选标准
设X1, X2, …, Xn 是总体X的一个样本,θ∈Θ\theta\in\Thetaθ∈Θ是待估参数。
(一)无偏性
若估计量θ^=θ^(X1,X2,...,Xn)\hat{\theta}=\hat{\theta}(X_1,X_2,...,X_n)θ^=θ^(X1,X2,...,Xn)的数学期望E(θ^)E(\hat{\theta})E(θ^)存在,且对于任意θ∈Θ\theta\in\Thetaθ∈Θ有E(θ^)=θE(\hat{\theta})=\thetaE(θ^)=θ,则称θ^\hat{\theta}θ^是θ\thetaθ的无偏估计量。
估计量取不同样本值的均值等于真实值。
(二)有效性
设θ1^=θ1^(X1,X2,...,Xn)\hat{\theta_1}=\hat{\theta_1}(X_1,X_2,...,X_n)θ1^=θ1^(X1,X2,...,Xn)与θ2^=θ2^(X1,X2,...,Xn)\hat{\theta_2}=\hat{\theta_2}(X_1,X_2,...,X_n)θ2^=θ2^(X1,X2,...,Xn)都是θ\thetaθ的无偏估计量,若对于任意θ∈Θ\theta\in\Thetaθ∈Θ有D(θ1^)⩽D(θ2^)D(\hat{\theta_1})\leqslant D(\hat{\theta_2})D(θ1^)⩽D(θ2^),且至少对于某一个θ∈Θ\theta\in\Thetaθ∈Θ上式中的不等号成立,则称θ^\hat{\theta}θ^较θ\thetaθ有效。
(三)相合性
设θ^(X1,X2,...,Xn)\hat{\theta}(X_1,X_2,...,X_n)θ^(X1,X2,...,Xn)为参数θ\thetaθ的估计量,若对于任意θ∈Θ\theta\in\Thetaθ∈Θ都满足:对任意ε>0\varepsilon>0ε>0,有limn→∞P{∣θ^−θ∣<ε}=1\lim\limits_{n\to\infty}P\{|\hat{\theta}-\theta|<\varepsilon\}=1n→∞limP{∣θ^−θ∣<ε}=1,则称θ^\hat{\theta}θ^是θ\thetaθ的相合估计量。
随着样本容量的增大,一个估计量的值稳定于待估参数的真值。
相合性是对一个估计量的基本要求。
三、区间估计
置信区间: 设总体X的分布函数F(x;θ)F(x;\theta)F(x;θ)含有一个未知参数θ∈Θ\theta\in\Thetaθ∈Θ,对于给定值α(0<α<1)\alpha(0<\alpha<1)α(0<α<1),若由来自X的样本X1, X2, …, Xn 确定的两个统计量θ‾=θ‾(X1,X2,...,Xn)\underline{\theta}=\underline{\theta}(X_1,X_2,...,X_n)θ=θ(X1,X2,...,Xn)和θ‾=θ‾(X1,X2,...,Xn)(θ‾<θ‾)\overline{\theta}=\overline{\theta}(X_1,X_2,...,X_n)(\underline{\theta}<\overline{\theta})θ=θ(X1,X2,...,Xn)(θ<θ),对于任意θ∈Θ\theta\in\Thetaθ∈Θ满足
P{θ‾(X1,X2,...,Xn)<θ<θ‾(X1,X2,...,Xn)}⩾1−α,P\{\underline{\theta}(X_1,X_2,...,X_n)<\theta<\overline{\theta}(X_1,X_2,...,X_n)\}\geqslant1-\alpha,P{θ(X1,X2,...,Xn)<θ<θ(X1,X2,...,Xn)}⩾1−α,
则称区间(θ‾,θ‾)(\underline{\theta},\overline{\theta})(θ,θ)是θ\thetaθ的置信水平为1−α1-\alpha1−α的置信区间,θ‾\underline{\theta}θ称为置信下限,θ‾\overline{\theta}θ称为置信上限,1−α1-\alpha1−α称为置信水平。
求置信区间的具体做法:
1.寻求一个样本X1, X2, …, Xn 和θ\thetaθ的函数W=W(X1,X2,...,Xn;θ)W=W(X_1,X_2,...,X_n;\theta)W=W(X1,X2,...,Xn;θ),使得WWW的分布不依赖于θ\thetaθ以及其他未知参数,称具有这种性质的函数WWW为枢轴量。
2.对于给定的置信水平1−α1-\alpha1−α,定出两个常数a,b使得
P{a<W(X1,X2,...,Xn;θ)<b}=1−α.P\{a<W(X_1,X_2,...,X_n;\theta)<b\}=1-\alpha.P{a<W(X1,X2,...,Xn;θ)<b}=1−α.
若能从a<W(X1,X2,...,Xn;θ)<ba<W(X_1,X_2,...,X_n;\theta)<ba<W(X1,X2,...,Xn;θ)<b得到与之等价的θ\thetaθ的不等式θ‾<θ<θ‾\underline{\theta}<\theta<\overline{\theta}θ<θ<θ,那么(θ‾,θ‾)(\underline{\theta},\overline{\theta})(θ,θ)就是θ\thetaθ的一个置信水平为1−α1-\alpha1−α的置信区间。
四、正态总体均值与方差的区间估计
(一)单个总体N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)的情况
1.均值μ\muμ的置信区间
(1)σ2\sigma^2σ2为已知,构造枢轴量X‾−μσ/n∼N(0,1)\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}}\sim N(0,1)σ/nX−μ∼N(0,1),按标准正态分布的上α\alphaα分位点的定义,有
P{∣X‾−μσ/n∣<zα/2}=1−αP\{|\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}}|<z_{\alpha/2}\}=1-\alphaP{∣σ/nX−μ∣<zα/2}=1−α
P{X‾−σnzα/2<μ<X‾+σnzα/2}=1−αP\{\overline{X}-\dfrac{\sigma}{\sqrt{n}}z_{\alpha/2}<\mu<\overline{X}+\dfrac{\sigma}{\sqrt{n}}z_{\alpha/2}\}=1-\alphaP{X−nσzα/2<μ<X+nσzα/2}=1−α
得到μ\muμ的置信水平为1−α1-\alpha1−α的置信区间为(X‾±σnzα/2)(\overline{X}\pm \dfrac{\sigma}{\sqrt{n}}z_{\alpha/2})(X±nσzα/2)
(2)σ2\sigma^2σ2为未知,将枢轴量X‾−μσ/n\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}}σ/nX−μ中的σ\sigmaσ替换为其无偏估计SSS,得X‾−μS/n∼t(n−1)\dfrac{\overline{X}-\mu}{S/\sqrt{n}}\sim t(n-1)S/nX−μ∼t(n−1),有
P{−tα/2(n−1)<X‾−μS/n<tα/2(n−1)}=1−αP\{-t_{\alpha/2}(n-1)<\dfrac{\overline{X}-\mu}{S/\sqrt{n}}<t_{\alpha/2}(n-1)\}=1-\alphaP{−tα/2(n−1)<S/nX−μ<tα/2(n−1)}=1−α
P{X‾−Sntα/2(n−1)<μ<X‾+Sntα/2(n−1)}=1−αP\{\overline{X}-\dfrac{S}{\sqrt{n}}t_{\alpha/2}(n-1)<\mu<\overline{X}+\dfrac{S}{\sqrt{n}}t_{\alpha/2}(n-1)\}=1-\alphaP{X−nStα/2(n−1)<μ<X+nStα/2(n−1)}=1−α
得到μ\muμ的置信水平为1−α1-\alpha1−α的置信区间为(X‾±Sntα/2(n−1))(\overline{X}\pm \dfrac{S}{\sqrt{n}}t_{\alpha/2}(n-1))(X±nStα/2(n−1))
2.方差σ2\sigma^2σ2的置信区间(μ\muμ未知)
构造枢轴量(n−1)S2σ2∼χ2(n−1)\dfrac{(n-1)S^2}{\sigma^2}\sim \chi^2(n-1)σ2(n−1)S2∼χ2(n−1),有
P{χ1−α/22(n−1)<(n−1)S2σ2<χα/22(n−1)}=1−αP\{\chi_{1-\alpha/2}^2(n-1)<\dfrac{(n-1)S^2}{\sigma^2}<\chi_{\alpha/2}^2(n-1)\}=1-\alphaP{χ1−α/22(n−1)<σ2(n−1)S2<χα/22(n−1)}=1−α
P{(n−1)S2χα/22(n−1)<σ2<(n−1)S2χ1−α/22(n−1)}=1−αP\{\dfrac{(n-1)S^2}{\chi_{\alpha/2}^2(n-1)}<\sigma^2<\dfrac{(n-1)S^2}{\chi_{1-\alpha/2}^2(n-1)}\}=1-\alphaP{χα/22(n−1)(n−1)S2<σ2<χ1−α/22(n−1)(n−1)S2}=1−α
得到σ2\sigma^2σ2的置信水平为1−α1-\alpha1−α的置信区间为((n−1)S2χα/22(n−1),(n−1)S2χ1−α/22(n−1))(\dfrac{(n-1)S^2}{\chi_{\alpha/2}^2(n-1)}, \dfrac{(n-1)S^2}{\chi_{1-\alpha/2}^2(n-1)})(χα/22(n−1)(n−1)S2,χ1−α/22(n−1)(n−1)S2)
(二)两个总体N(μ1,σ12),N(μ2,σ22)N(\mu_1,\sigma_1^2), N(\mu_2,\sigma_2^2)N(μ1,σ12),N(μ2,σ22)的情况
1.两个总体均值差μ1−μ2\mu_1-\mu_2μ1−μ2的置信区间
(1)σ12,σ22\sigma_1^2,\sigma_2^2σ12,σ22均为已知。X‾,Y‾\overline{X},\overline{Y}X,Y分别为μ1,μ2\mu_1,\mu_2μ1,μ2的无偏估计,故X‾−Y‾\overline{X}-\overline{Y}X−Y是μ1−μ2\mu_1-\mu_2μ1−μ2的无偏估计。由X‾,Y‾\overline{X},\overline{Y}X,Y的独立性以及X‾∼(μ1,σ12/n1),Y‾∼(μ2,σ22/n2)\overline{X}\sim(\mu_1,\sigma_1^2/n_1),\overline{Y}\sim(\mu_2,\sigma_2^2/n_2)X∼(μ1,σ12/n1),Y∼(μ2,σ22/n2)得
X‾−Y‾∼N(μ1−μ2,σ12n1+σ22n2)\overline{X}-\overline{Y}\sim N(\mu_1-\mu_2,\dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2})X−Y∼N(μ1−μ2,n1σ12+n2σ22)
(X‾−Y‾)−(μ1−μ2)σ12n1+σ22n2∼N(0,1)\dfrac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{\sqrt{\dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}}}\sim N(0,1)n1σ12+n2σ22(X−Y)−(μ1−μ2)∼N(0,1)
得到μ1−μ2\mu_1-\mu_2μ1−μ2的置信水平为1−α1-\alpha1−α的置信区间为(X‾−Y‾±zα/2σ12n1+σ22n2)(\overline{X}-\overline{Y}\pm z_{\alpha/2}\sqrt{\dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}})(X−Y±zα/2n1σ12+n2σ22)
(2)σ12=σ22=σ2\sigma_1^2=\sigma_2^2=\sigma^2σ12=σ22=σ2,但σ2\sigma^2σ2为未知。构造枢轴量
(X‾−Y‾)−(μ1−μ2)Sw1n1+1n2∼t(n1+n2−2)\dfrac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{S_w\sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}}\sim t(n_1+n_2-2)Swn11+n21(X−Y)−(μ1−μ2)∼t(n1+n2−2)
得到μ1−μ2\mu_1-\mu_2μ1−μ2的置信水平为1−α1-\alpha1−α的置信区间为
(X‾−Y‾±tα/2(n1+n2−2)Sw1n1+1n2)(\overline{X}-\overline{Y}\pm t_{\alpha/2}(n_1+n_2-2)S_w\sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}})(X−Y±tα/2(n1+n2−2)Swn11+n21)
此处Sw2=(n1−1)S12+(n2−1)S22n1+n2−2,Sw=Sw2.S_w^2=\dfrac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}, S_w=\sqrt{S_w^2}.Sw2=n1+n2−2(n1−1)S12+(n2−1)S22,Sw=Sw2.
2.两个总体方差比σ12/σ22\sigma_1^2/\sigma_2^2σ12/σ22的置信区间(μ1,μ2\mu_1,\mu_2μ1,μ2均为未知)
构造枢轴量S12/S22σ12/σ22∼F(n1−1,n2−1)\dfrac{S_1^2/S_2^2}{\sigma_1^2/\sigma_2^2}\sim F(n_1-1,n_2-1)σ12/σ22S12/S22∼F(n1−1,n2−1)得
P{F1−α/2(n1−1,n2−1)<S12/S22σ12/σ22<Fα/2(n1−1,n2−1)}=1−αP\{F_{1-\alpha/2}(n_1-1,n_2-1)<\dfrac{S_1^2/S_2^2}{\sigma_1^2/\sigma_2^2}<F_{\alpha/2}(n_1-1,n_2-1)\}=1-\alphaP{F1−α/2(n1−1,n2−1)<σ12/σ22S12/S22<Fα/2(n1−1,n2−1)}=1−α
P{S12S221Fα/2(n1−1,n2−1)<σ12σ22<S12S221F1−α/2(n1−1,n2−1)}=1−αP\{\dfrac{S_1^2}{S_2^2}\dfrac{1}{F_{\alpha/2}(n_1-1,n_2-1)}<\dfrac{\sigma_1^2}{\sigma_2^2}<\dfrac{S_1^2}{S_2^2}\dfrac{1}{F_{1-\alpha/2}(n_1-1,n_2-1)}\}=1-\alphaP{S22S12Fα/2(n1−1,n2−1)1<σ22σ12<S22S12F1−α/2(n1−1,n2−1)1}=1−α
得到σ12/σ22\sigma_1^2/\sigma_2^2σ12/σ22的置信水平为1−α1-\alpha1−α的置信区间为
(S12S221Fα/2(n1−1,n2−1),S12S221F1−α/2(n1−1,n2−1))(\dfrac{S_1^2}{S_2^2}\dfrac{1}{F_{\alpha/2}(n_1-1,n_2-1)},\dfrac{S_1^2}{S_2^2}\dfrac{1}{F_{1-\alpha/2}(n_1-1,n_2-1)})(S22S12Fα/2(n1−1,n2−1)1,S22S12F1−α/2(n1−1,n2−1)1)
五、(0-1)分布参数的区间估计
(0-1)分布的均值和方差分别为μ=p,σ2=p(1−p)\mu=p,\sigma^2=p(1-p)μ=p,σ2=p(1−p),X1, X2, …, Xn 是一个样本,当样本容量n较大时,由中心极限定理知
∑i=1nXi−npnp(1−p)=nX‾−npnp(1−p)近似地~N(0,1)\dfrac{\sum\limits_{i=1}^{n}X_i-np}{\sqrt{np(1-p)}}=\dfrac{n\overline{X}-np}{\sqrt{np(1-p)}}\utilde{\footnotesize 近似地}N(0,1)np(1−p)i=1∑nXi−np=np(1−p)nX−np近似地N(0,1),于是有
P{−zα/2<nX‾−npnp(1−p)<zα/2}≈1−αP\{-z_{\alpha/2}<\dfrac{n\overline{X}-np}{\sqrt{np(1-p)}}<z_{\alpha/2}\}\approx1-\alphaP{−zα/2<np(1−p)nX−np<zα/2}≈1−α
而不等式−zα/2<nX‾−npnp(1−p)<zα/2-z_{\alpha/2}<\dfrac{n\overline{X}-np}{\sqrt{np(1-p)}}<z_{\alpha/2}−zα/2<np(1−p)nX−np<zα/2等价于
(n+zα/22)p2−(2nX‾+zα/22)p+nX‾2<0(n+z^2_{\alpha/2})p^2-(2n\overline{X}+z^2_{\alpha/2})p+n\overline{X}^2<0(n+zα/22)p2−(2nX+zα/22)p+nX2<0
记
p1=12a(−b−b2−4ac),p2=12a(−b+b2−4ac),p_1=\dfrac{1}{2a}(-b-\sqrt{b^2-4ac}),p_2=\dfrac{1}{2a}(-b+\sqrt{b^2-4ac}),p1=2a1(−b−b2−4ac),p2=2a1(−b+b2−4ac),
此处a=n+zα/22,b=−(2nX‾+zα/22),c=nX‾2.a=n+z^2_{\alpha/2},b=-(2n\overline{X}+z^2_{\alpha/2}),c=n\overline{X}^2.a=n+zα/22,b=−(2nX+zα/22),c=nX2.于是ppp的一个近似置信水平为1−α1-\alpha1−α的置信区间为(p1,p2)(p_1,p_2)(p1,p2)。
六、单侧置信区间
对于给定值α(0<α<1)\alpha(0<\alpha<1)α(0<α<1),若由样本X1, X2, …, Xn 确定的统计量θ‾=θ‾(X1,X2,...,Xn)\underline{\theta}=\underline{\theta}(X_1,X_2,...,X_n)θ=θ(X1,X2,...,Xn),对于任意θ∈Θ\theta\in\Thetaθ∈Θ满足
P{θ>θ‾}⩾1−α,P\{\theta>\underline{\theta}\}\geqslant1-\alpha,P{θ>θ}⩾1−α,
称随机区间(θ‾,∞)(\underline{\theta},\infty)(θ,∞)是θ\thetaθ的置信水平为1−α1-\alpha1−α的单侧置信区间,θ‾\underline{\theta}θ称为θ\thetaθ的置信水平为1−α1-\alpha1−α的单侧置信下限。
又若统计量θ‾=θ‾(X1,X2,...,Xn)\overline{\theta}=\overline{\theta}(X_1,X_2,...,X_n)θ=θ(X1,X2,...,Xn)对于任意θ∈Θ\theta\in\Thetaθ∈Θ满足
P{θ<θ‾}⩾1−α,P\{\theta<\overline{\theta}\}\geqslant1-\alpha,P{θ<θ}⩾1−α,
称随机区间(−∞,θ‾)(-\infty,\overline{\theta})(−∞,θ)是θ\thetaθ的置信水平为1−α1-\alpha1−α的单侧置信区间,θ‾\overline{\theta}θ称为θ\thetaθ的置信水平为1−α1-\alpha1−α的单侧置信上限。
例如正态总体X,若均值μ\muμ,方差σ2\sigma^2σ2均未知,设X1, X2, …, Xn 是一个样本,由X‾−μS/n∼t(n−1)\dfrac{\overline{X}-\mu}{S/\sqrt{n}}\sim t(n-1)S/nX−μ∼t(n−1)有
P{X‾−μS/n<tα(n−1)}=1−αP\{\dfrac{\overline{X}-\mu}{S/\sqrt{n}}<t_{\alpha}(n-1)\}=1-\alphaP{S/nX−μ<tα(n−1)}=1−α,即
P{μ>X‾−Sntα(n−1)}=1−αP\{\mu>\overline{X}-\dfrac{S}{\sqrt{n}}t_{\alpha}(n-1)\}=1-\alphaP{μ>X−nStα(n−1)}=1−α
于是得到μ\muμ的置信水平为1−α1-\alpha1−α的单侧置信区间为(X‾−Sntα(n−1),∞)(\overline{X}- \dfrac{S}{\sqrt{n}}t_{\alpha}(n-1),\infty)(X−nStα(n−1),∞)
μ\muμ的置信水平为1−α1-\alpha1−α的单侧置信下限为μ‾=X‾−Sntα(n−1)\underline{\mu}=\overline{X}- \dfrac{S}{\sqrt{n}}t_{\alpha}(n-1)μ=X−nStα(n−1)
又如(n−1)S2σ2∼χ2(n−1)\dfrac{(n-1)S^2}{\sigma^2}\sim \chi^2(n-1)σ2(n−1)S2∼χ2(n−1),有
P{(n−1)S2σ2>χ1−α2(n−1)}=1−αP\{\dfrac{(n-1)S^2}{\sigma^2}>\chi_{1-\alpha}^2(n-1)\}=1-\alphaP{σ2(n−1)S2>χ1−α2(n−1)}=1−α,即
P{σ2<(n−1)S2χ1−α2(n−1)}=1−αP\{\sigma^2<\dfrac{(n-1)S^2}{\chi_{1-\alpha}^2(n-1)}\}=1-\alphaP{σ2<χ1−α2(n−1)(n−1)S2}=1−α
于是得到σ2\sigma^2σ2的置信水平为1−α1-\alpha1−α的单侧置信区间为
(0,(n−1)S2χ1−α2(n−1))(0, \dfrac{(n-1)S^2}{\chi_{1-\alpha}^2(n-1)})(0,χ1−α2(n−1)(n−1)S2)
σ2\sigma^2σ2的置信水平为1−α1-\alpha1−α的单侧置信上限为σ2‾=(n−1)S2χ1−α2(n−1)\overline{\sigma^2}=\dfrac{(n-1)S^2}{\chi_{1-\alpha}^2(n-1)}σ2=χ1−α2(n−1)(n−1)S2