抽样与重抽样技术详解
1. 大数定律
1.1 弱大数定律
在概率论中,随着样本量趋向于无穷大,样本均值会收敛到期望值。也就是说,随着试验次数或样本量的增加,样本均值接近真实均值的概率也会增加。弱大数定律也被称为辛钦定律,以纪念他的贡献。其数学表达为:对于任意正数 $\epsilon$,有 $\lim_{n \to \infty} Pr(|X_n - \mu| > \epsilon) = 0$。
1.2 强大数定律
强大数定律和弱大数定律之间存在微妙的区别。强大数定律表明样本均值以概率 1 收敛到真实均值,而弱大数定律只是说它们会收敛。因此,在通过样本均值估计总体均值时,强大数定律的表述更有力。数学表达为:$Pr(\lim_{n \to \infty} X_n = \mu) = 1$。
1.3 硬币抛掷实验模拟
假设我们有一枚有偏的硬币,要确定抛这枚硬币得到“正面”的概率。根据大数定律,如果多次进行抛硬币实验,就能够找到得到正面的实际概率。以下是使用 R 代码进行模拟的步骤:
1. 设置二项分布参数 :
library(data.table)
n <- 100
p <- 0.6
这里我们设定了实验的真实均值,即总体服从参数 $p = 0.6$ 的二项分布。随着实验次数的增加,实验将帮助我们估计这个值。
2. 从二项分布中抽样 :