深入解析python版SVM源码系列(三)——计算样本的预测类别

系列(二)中,对于SMO算法中有一个重要的代码:计算样本的预测类别。如下:

fXi = float(multiply(alphas,labelMat).T*(dataMatrix*dataMatrix[i,:].T)) + b  # 第i样本的预测类别

我们知道原始的预测类别计算公式是用决策面的参数w和b表示的,那么为什么这里的貌似不一样呢?
原始的预测类别计算公式为:
这里写图片描述

其中w可以表示为:
这里写图片描述

然后分类函数可以转化为:
这里写图片描述

关于这个的解释,july博客上说的比较清晰:

这里的形式的有趣之处在于,对于新点 x的预测,只需要计算它与训练数据点的内积即可(<.>表示向量内积),这一点至关重要,是之后使用 Kernel 进行非线性推广的基本前提。

这样子的表示形式和上面代码就一致了。

这儿还有一个现象可以分析出来:哪些是支持向量。
答:alpha不等于0的为支持向量。

所谓 Supporting Vector 也在这里显示出来——事实上,所有非Supporting Vector

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值