13、分布理论中的误差率分析

分布理论中的误差率分析

在数据分类和判别分析中,误差率的估计是一个关键问题。不同的采样方法和误差估计技术会对误差率的计算产生影响。下面将详细介绍几种常见的误差估计方法及其相关理论。

1. 自助法误差(Bootstrap Error)

自助法误差估计有两种情况:混合采样和单独采样。

1.1 混合采样情况

设 (C = (C_1, \ldots, C_n)) 是长度为 (n) 的多项分布向量。从样本 (S_n) 中生成的自助样本 (S_C^n) 对应于对 (S_n) 中第 (i) 个数据点重复 (C_i) 次。多项分布向量 (C) 服从 (C \sim Multinomial(n, \frac{1}{n}, \ldots, \frac{1}{n})),其概率为:
[P(C) = P(C_1 = c_1, \ldots, C_n = c_n) = \frac{1}{n^n} \frac{n!}{c_1! \cdots c_n!}, \quad c_1 + \cdots + c_n = n]

定义 (\hat{\varepsilon} C^n) 为自助分类器在自助样本之外的数据上的错误率:
[\hat{\varepsilon}_C^n = \frac{1}{n(C)} \sum
{i=1}^{n} (I_{W(S_C^n, X_i) \leq 0} I_{Y_i = 0} + I_{W(S_C^n, X_i) > 0} I_{Y_i = 1}) I_{C_i = 0}]
其中 (n(C) = \sum_{i=1}^{n} I_{C_i = 0}) 是 (C) 中零的个数。完全零自助误差估

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值