1.经验风险:分类器在给定样本上的误差
置信风险:分类器在未知样本上分类的结果的可信任程度
2.SVM分类器本质:寻找一个最优超平面,使得离超平面较近的点能有更大的间距,即寻找最优间隔
3.核函数:将在低维空间不可分样本映射到高维空间,从而可分。若经核函数映射仍不可分,则引入松弛变量
4.优化算法SMO
由原始的优化间隔问题经对偶转化为最后的优化问题,引入拉格朗日乘子。
每一次采用启发式方法选两个参数优化:优先选择样本前面系数在区间(0,C)的作优化,因为在界上的样例对应的系数一般不会更改。
5.最后收敛条件是在区间(0,C)内的样例都能遵循KTT条件,且其对应的系数只在极小的范围内变动。
SVM分类器详解可参考:http://www.blogjava.net/zhenandaci/