集成偏差/方差分解中的断层扫描考量与 fMRI 分类随机子空间集成参数选择
1. 集成偏差/方差分解的断层扫描考量
1.1 偏差计算
偏差总和(BiasSum)的计算公式如下:
[
BiasSum = \sum_{i = 1}^{n} \frac{1}{n} \int_{\forall x_j:j\neq i} dx’ i \int {x_i} \sum_{K = 1}^{K_{tot}} D_i(x_i - c^K_i)^2 dx_i - \int_{\forall X_n} D(x - c^K)^2 dx
]
在稀疏条件下,即 $\frac{\Delta_i}{\omega_i} >> K_{tot}$ 时,对于每个分类器只有单个特征且分布中心符合散粒噪声模型的情况,线性决策方案的偏差总是高于断层扫描过滤后的等效方案。并且,随着维度和稀疏性的增加,这个问题会变得更严重。
1.2 方差估计
在简化模型中,通过考虑代表分类器的边缘直方图的采样变化引入方差。单特征分类器内的方差会因边缘积分而降低,记为 $v_i$。此外,特征选择中隐含的反投影有可能通过求和进一步降低方差。
- 总和规则的方差 :在聚类中心,假设去相关的情况下,方差为 $\frac{1}{n^2} \sum_{i = 1}^{n} v_i$;在其他地方,轴向分量的方差与边缘分布相同,即 $v_i$。总体方差约为:
[
Variance_{Sum} \approx \sum_{i} (\frac{\Delta_i}{\omega_i} - K_{tot
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



