支持向量与核方法入门:从基础概念到算法应用
在当今的科技领域,构建能够适应环境并从经验中学习的系统成为了众多科研人员的目标。这一目标吸引了计算机科学、工程学、数学、物理学、神经科学和认知科学等多个领域的研究者。在这个过程中,涌现出了各种各样的学习技术,这些技术有望改变众多科学和工业领域。其中,基于核的学习方法因其独特的优势和广泛的应用前景,成为了研究的热点之一。本文将为您介绍支持向量(SV)学习的核心概念,包括数据表示与相似性、简单的模式识别算法、统计学习理论的基本见解,以及一些主要的核算法。
1. 数据表示与相似性
学习理论中的一个基本问题是:给定两类对象,当面对一个新对象时,如何将其分配到其中一类。这个问题可以通过经验数据来形式化:
- 训练数据 :我们得到经验数据 ((x_1, y_1), \cdots, (x_m, y_m) \in \mathcal{X} \times {-1, +1}),其中 (\mathcal{X}) 是一个非空集合,被称为域,模式 (x_i) (有时也称为案例、输入、实例或观察值)来自这个集合;(y_i) 被称为标签、目标、输出或观察值。这里只有两类模式,为了数学上的方便,分别用 (-1) 和 (+1) 标记,这就是所谓的(二元)模式识别或(二元)分类问题。需要强调的是,模式可以是任何东西,我们对 (\mathcal{X}) 只做了它是一个集合的假设。例如,任务可能是将绵羊分为两类,此时模式 (x_i) 就是绵羊。
- 相似性度量 :为了研究学习问题,我们需要额外的结构。在学习中,我们希望能够将所学知识推广到未见过的数据点。在模式识别中,这意味着对于新的模式 (x \in
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



