机器学习-感知机(perceptron)
感知机模型
感知机是一种线性的、二类分类模型,可以将空间划分为正类和负类,是一种判别模型,输入为具体的实例,输出为实例的类别(+1,-1)。有原始形式和对偶形式两种。感知机是神经网络和支持向量机的基础。
感知机预测是利用学习到的模型对输入实例进行类别的划分。
由输入空间到输出空间有如下函数:
f(x) = sign(w*x+b)
感知机学习策略
假设数据集是线性可分(可以使用一个超平面完全将正负数据划分开来),我们要做的就是找到一个线性函数将训练集中的正负实例点完全划分开来。
线性函数中的未知参数是w、b,所以我们的任务就是找到满足上述条件的参数值,若要找到相应的参数值,就需要通过损失函数来寻找w、b。
我们可以选用误分类点的总数作为我们的损失函数,但是这样的损失函数中的参数w、b不是连续变化的,在后面不利于求导优化。所以我们选择的损失函数是误分类点到初始超平面的距离总和。公式如下:
||w||为w的L2范数:w的平方开根号
所有误分类点到超平面的距离为:
在李航的书中不考虑1/||w||,由此得到损失函数,我还没弄清怎么回事。
综上,感知机sign(w*x+b)的损失函数为:
M是误分类点的总数,这