首先,参数估计是指用样本统计量去估计总体的参数,参数估计的方法有点估计和区间估计。
- 点估计是用估计量的某个取值来直接作为总体参数的取值,比如用样本均值作为总体均值,样本方差作为总体方差,但点估计无法得到估计的可靠性,也无法说出点估计值与总体参数真实值接近的程度,所以我们应该围绕点估计值构造出总体参数的一个区间
- 区间估计是在点估计的基础上得到总体参数的一个估计区间,该区间通常是由样本统计量加减估计误差得到的。
- 在区间估计中,由样本估计量构造出的总体参数在一定置信水平下的估计区间称为置信区间;假定抽取100个样本构造出100个置信区间,这100个置信区间中有95%的区间包含总体参数的真值,则95%这个值称为置信水平。
一、评量估计量的标准
1.无偏性:指估计量抽样分布的期望值等于被估计的总体参数。
#无偏性
#样本均值、样本中位数和样本方差的无偏性模拟
x<-vector();m<-vector();v<-vector()
n=10
for(i in 1:10000){
d<-rnorm(n,50,10)
x<-append(x,mean(d))
m<-append(m,median(d))
v<-append(v,var(d))
}
data.frame(mean(x),mean(m),mean(v))
2.有效性:指估计量的方差大小。
#有效性
#计算样本均值的方差和样本中位数的方差
x<-vector();m<-vector()
n=10;
for(i in 1:10000){
d<-rnorm(n)
x<-append(x,mean(d))
m<-append(m,median(d))
}
data.frame(var(x),var(m))
- 我们可以进一步绘制均值和样本中位数分布的直方图,如下:
par(mfrow=c(1,2),mai=c(0.7,0.7,0.4,0.2),cex=0.8)
hist(x,prob=T,col="lightblue",xlim=c(-1.5,<