SVM(Support Vector Machine, 支持向量机)有很多实现,但是本章其中最流行的一种实现,即序列最小优化(Sequence Minimal Optimization, SMO)算法。
最小优化(Sequence Minimal Optimization, SMO)算法 一种求解支持向量机二次规划的算法。
6.1 基于最大间隔分隔数据
支持向量机
优点:泛化错误率低,计算开销不大,结果易解释。
缺点:对参数调节和核函数的选择敏感,原始分类器不加修改仅使用于处理二类问题。
使用数据类型:数值型和标称型数据。
线性可分(linearly separable):
两类点被一条直线完全分开
数学定义:
D 0 D_0 D0和 D 1 D_1 D1是 n n n维度欧氏空间中的两个点集。如果存在 n n n维向量 w ⃗ \vec w w和实数 b b b,使得所有属于 D 0 D_0 D0的点 x i x_i xi都有 w x i + b > 0 wx_i + b > 0 wx