感知机(perceptron)是1957年由Rosenblatt提出,是神经网络与支持向量机的基础。感知机是二分类的线性可分类模型,其输入为实例的特征向量,输出为实例的类别,取+1和-1两个值。感知机只能应用到线性可分的数据集当中,对于线性不可分的问题感知机无法解决,其原理其实很简单:在特征空间中找到一个超平面将两类样本划分到超平面两侧,实现样品种类的划分。
1.感知机模型
假设输入空间是,输出空间是
,输入
表示实例的特征向量,对于输入空间的点,输出
表示实例的类别,感知机模型可以如下形式:
其中w和b为感知机的参数,w为权重(weight),b为偏置(bias),是w与x的内积,sign为符号函数,如下
其函数形式如下图所示:
感知机是一种线性分类器,属于判别模型。感知机有如下的几何解释:
线性方程对应于特征空间的一个超平面S,其中w是超平面的法向量,b是超平面的截距,这个超平面将特征空间划分为两个部分,位于超平面两侧的点被分为+1、-1两类。因此,超平面S称为分离超平面,如下图所示&#