PAC - Bayesian 边界:理论与应用
1. 引言
在机器学习领域,分类器的性能评估和泛化能力分析至关重要。PAC - Bayesian 边界为我们提供了一种有效的方法来研究分类器在不同情况下的泛化性能。本文将深入探讨 PAC - Bayesian 边界的相关理论,包括 Gibbs 分类器和 Bayes 分类器的定义、单分类器和组合分类器的 PAC - Bayesian 边界,以及这些理论在大间隔分类器中的应用。
2. Gibbs 分类器和 Bayes 分类器
在传统的分类器概念基础上,我们将视角从单个分类器扩展到分类器的分布。这意味着我们不再局限于确定性的预测,而是根据某种概率分布 $P(y|x)$ 来获得预测结果。同时,我们需要将函数 $f$ 的经验损失或期望损失的概念扩展到关于分布的损失。
- 风险定义 :
- 设 $P(f)$ 是分类器集合 $\mathcal{F}$ 上的分布,风险泛函定义如下:
- 期望风险:$R[P(f)] := E_{f\sim P(f)}[R[f]]$
- 经验风险:$R_{emp}[P(f)] := E_{f\sim P(f)}[R_{emp}[f]]$
- 正则化风险:$R_{reg}[P(f)] := E_{f\sim P(f)}[R_{emp}[f] + \lambda\Omega[f]]$
- 设 $P(f)$ 是分类器集合 $\mathcal{F}$ 上的分布,风险泛函定义如下:
- Gibbs 分类器 :
PAC-Bayesian边界理论与应用
超级会员免费看
订阅专栏 解锁全文
23

被折叠的 条评论
为什么被折叠?



