数据重采样与多设计测试的统计分析
1. 重采样技术
为了直观理解 t 检验如何从少量数据中确认和计算统计量,我们可以采用重采样方法。重采样基于这样一个前提:每个样本只是总体中无数可能样本之一。通过从现有样本中抽取多个新样本,我们可以深入了解其他可能样本的特征,从而更好地理解潜在总体。
重采样有多种技术,这里讨论其中最简单的一种——自助法(Bootstrapping)。在自助法中,我们通过有放回地从原始样本中重复随机抽取值,直到生成一个与原始样本大小相同的新样本。由于每次随机抽取后值会被放回,所以同一个源值可能在新样本中多次出现,就像从一副扑克牌中反复随机抽牌,每次抽完后都将牌放回,偶尔会抽到之前选过的牌。
在 Incanter 中,我们可以使用 bootstrap 函数轻松地对样本进行自助法重采样,生成多个重采样样本。 bootstrap 函数接受两个参数:原始样本和要在重采样样本上计算的汇总统计量,还有一些可选参数,如 :size (要计算的重采样样本数量,每个样本大小与原始样本相同)、 :smooth (是否对离散统计量的输出进行平滑处理,如中位数)、 :smooth-sd 和 :replacement (默认为 true )。以下是示例代码:
(defn ex-2-19 []
(let [data (->> (load-data "new-site.tsv")
超级会员免费看
订阅专栏 解锁全文
171万+

被折叠的 条评论
为什么被折叠?



