离散分类误差估计的小样本与大样本性能分析
1. 引言
在离散分类问题中,误差估计是评估分类器性能的关键环节。不同的误差估计方法在小样本和大样本情况下表现各异,了解它们的性能特点对于选择合适的估计方法至关重要。本文将详细探讨重代入法、留一法等误差估计方法在小样本和大样本下的性能。
2. 小样本性能
2.1 方差计算
- 重代入误差估计器的方差 :根据公式,重代入误差估计器的方差为
[
Var (\hat{\varepsilon} r^n) = \frac{1}{n^2} \sum {i=1}^{b} \left[ Var(U_i I_{U_i< V_i}) + Var(V_i I_{U_i\geq V_i}) + 2Cov(U_i I_{U_i< V_i}, V_i I_{U_i\geq V_i}) \right] + \frac{2}{n^2} \sum_{i<j} \left[ Cov(U_i I_{U_i< V_i}, U_j I_{U_j< V_j}) + Cov(U_i I_{U_i< V_i}, V_j I_{U_j\geq V_j}) + Cov(U_j I_{U_j< V_j}, V_i I_{U_i\geq V_i}) + Cov(V_i I_{U_i\geq V_i}, V_j I_{U_j\geq V_j}) \right]
]
其中,各方差和协方差可通过以下公式计算:
[
Var(U_i I_{U_i< V_i}) = \sum_{k<l} k^2
超级会员免费看
订阅专栏 解锁全文
4708

被折叠的 条评论
为什么被折叠?



