目录
感知机
感知机模型
感知机是什么?
简单地说感知机是一种映射,对来自输入空间的特征,映射到输出空间中
,它是一种线性分类器,只输出正负结果。
将称为感知机,w,b分别为该感知机的权值(weight)和偏置(bias),sign是符号函数,有两种输出结果
感知机的几何解释
从符号函数可以感受到感知机就是为了成就一个分离超平面,这个平面可以根据线性函数将特征空间分成正负两部分,达到分类的效果。用图以助理解
图中的细节原点指向超平面的距离,以及向量
的方向将在下面交代。
感知机的学习
感知机作为一种监督学习的模型,其存在的意义固然是给定一堆带标注的数据让它训练出一个模型,以助于对未知特征的标注。因此感知机的学习就是训练出中的w和b。
定义点到超平面的距离
空间中的点到超平面S的距离为
,证明见本节“距离函数的证明”。
定义损失函数
将训练数据中被误分类的点到超平面的距离总和定义为感知机的损失期望
,M表示误分类的集合
当时,
的值总为负,对总和加上符号表示取损失值为正。
如果不考虑不考虑权值w的2-范数,则损失函数可以简化为
距离函数的证明
1.首先明确一个,权值向量的方向总是垂直于超平面*①。
因为超平面S:
有 ,
直观看来就是上图超平面直线的斜率
而权值向量 ,映射到上面的图中,将其看成直线,其斜率为
有 ,表示
。
2.令表示空间上的点,
表示超平面上的点,两点的距离为d,
有