利用瓮模型模拟抽样与实验:从选举民意调查到疫苗试验和空气质量测量
1. 选举民意调查中的瓮模型应用
在选举民意调查中,我们可以使用瓮模型来模拟随机抽样过程。即使样本收集完全无偏差,样本正确预测特朗普在2016年选举中获胜的概率约为60%,而预测错误的概率约为40%。
1.1 无偏差的瓮模型
我们使用瓮模型研究简单民意调查中的变化,假设选择过程无偏差(就像从超过六百万个弹珠中抽取1500个弹珠,每个弹珠都无差异,且每种可能的组合概率相等)。
1.2 有偏差的瓮模型
现实中很难控制所有偏差来源。以一个小的教育偏差为例,假设存在0.5%有利于希拉里·克林顿的偏差。原本克林顿的支持率为47.46%,有偏差后变为47.96%,特朗普的支持率从48.18%变为47.68%。我们调整瓮中弹珠的比例来反映这种变化:
bias = 0.005
proportions_bias = np.array([0.4818 - bias, 0.4747 + bias,
1 - (0.4818 + 0.4746)])
proportions_bias
# 输出: array([0.48, 0.48, 0.04])
votes_bias = np.trunc(N * proportions_bias).astype(int)
votes_bias
# 输出: array([2939699, 2957579, 268814])
再次进行模拟研究,使用有偏差的瓮,结果大不相同。特朗普在约4
超级会员免费看
订阅专栏 解锁全文
4890

被折叠的 条评论
为什么被折叠?



