用R软件随机模拟产生6组均值为5,方差为100的随机数,其样本个数分别设为100,1000,10000,100000,1000000,10000000,100000000。观察各组数据的样本方差和样本均值的差异。下面给出模拟程序:
n <- c(100,1000,10000,100000,1000000,10000000,100000000)
for(i in 1:length(n)){
mean01[i] <- mean(rnorm(n[i], mean=5, sd=10))
var01[i] <- var(rnorm(n[i], mean=5, sd=10))
sd01[i] <- sd(rnorm(n[i], mean=5, sd=10))
}
result <- data.frame(Mean=mean01,Var=var01,Sd=sd01)
result
为对比不同的样本对随机数的均值和方差的影响,下面给出6组对照表,其结果见表3。从表3可明显看出,随着样本量的增大,其产生随机数的样本均值和方差越接近于设定的均值和方差,即样本均值稳定于(接近于)总体均值,样本方差稳定于(接近于)总体方差。


使用R语言模拟产生了6组正态分布随机数,样本量从100到100000000逐步增大,均值固定为5,方差为100。通过观察,发现随着样本数量增加,样本均值和方差越来越接近设定的真实值,体现了大数定律的效应,样本统计量趋于稳定并逼近总体参数。
2952

被折叠的 条评论
为什么被折叠?



