18、统计学习中的Bootstrap方法及其应用

统计学习中的Bootstrap方法及其应用

1. 引言

在统计学习领域,准确估计回归函数和分类函数至关重要。为了实现这一目标,我们常常需要处理估计误差和预测分布的问题。Bootstrap方法作为一种强大的工具,为我们提供了有效的解决方案。它不仅可以用于近似估计误差的分布,还能用于计算预测分布,进而得到置信区间,提高预测的准确性。

2. 估计误差的分布

估计误差 $\sqrt{N}(\hat{m}(x) - m(x))$ 近似服从均值为 0、方差为 $\sigma_x^2$ 的正态分布,其中 $\hat{m}(x)$ 是回归函数 $m(x)$ 的估计值,$N$ 是样本数量。然而,对于复杂函数和样本量不是很大的情况,使用Bootstrap方法可以得到更好的近似。

在适当条件下,对于许多距离度量 $d$,如 $d_K$,有:
$d(\sqrt{N}(\hat{m}(x) - m(x)), \sqrt{N}(\hat{m}^b(x) - \tilde{m}(x)))$ 随着 $N$ 的增大收敛于 0。这里,$\hat{m}^b(x)$ 是根据第 $b$ 个伪样本计算得到的回归函数估计值,$\tilde{m}(x)$ 是已知的初始估计值。

因此,$\sqrt{N}(\hat{m}(x) - m(x))$ 的分布可以用 $\sqrt{N}(\hat{m}^b(x) - \tilde{m}(x))$ 的(条件)分布来近似,前提是原始训练集 $X_j, Y_j, j = 1, \cdots, N$ 已知。

Bootstrap近似的优势在于 $\tilde{m}(x)$ 是已知的。通过从原始训练集中抽取 $B$ 个Boots

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值