8、数据重采样与多设计测试的统计分析

数据重采样与多设计测试的统计分析

1. 重采样技术

为了直观理解 t 检验如何从少量数据中确认和计算统计量,我们可以采用重采样方法。重采样基于这样一个前提:每个样本只是总体中无数可能样本之一。通过从现有样本中抽取多个新样本,我们可以深入了解其他可能样本的特征,从而更好地理解潜在总体。

重采样有多种技术,这里讨论其中最简单的一种——自助法(Bootstrapping)。在自助法中,我们通过有放回地从原始样本中重复随机抽取值,直到生成一个与原始样本大小相同的新样本。由于每次随机抽取后值会被放回,所以同一个源值可能在新样本中多次出现,就像从一副扑克牌中反复随机抽牌,每次抽完后都将牌放回,偶尔会抽到之前选过的牌。

在 Incanter 中,我们可以使用 bootstrap 函数轻松地对样本进行自助法重采样,生成多个重采样样本。 bootstrap 函数接受两个参数:原始样本和要在重采样样本上计算的汇总统计量,还有一些可选参数,如 :size (要计算的重采样样本数量,每个样本大小与原始样本相同)、 :smooth (是否对离散统计量的输出进行平滑处理,如中位数)、 :smooth-sd :replacement (默认为 true )。以下是示例代码:

(defn ex-2-19 []
  (let [data (->> (load-data "new-site.tsv")
    
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值