感知机

感知机是一种二类线性分类模型,寻找能够将数据分离的超平面。学习策略基于误分点到超平面的总距离最小化,采用随机梯度下降法进行迭代更新。感知机学习算法包括原始形式和对偶形式,对偶形式中实例以内积形式出现,便于计算。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 概念

感知机是一个二类分类的线性分类模型。所谓二类分类就是它只能将实例分为正类和负类两个类别。那么为什么是线性分类模型呢,我的理解是感知机学习旨在求出可以将数据进行划分的分离超平面,而分离超平面的方程:
w⋅x+b=0
为线性方程,所以感知机为线性分类模型。

2. 感知机模型

模型如下图所示:
这里写图片描述
圈圈表示正类,而叉叉表示负类。圈圈与叉叉之间的直线即上文所说的分离超平面(注意分离超平面并不是唯一的!)它将所有的样本划分为两部分。位于分离超平面上方的为正类,记为+1,位于分离超平面下方的为负类,记为-1。也就是说,假设给一个样本的特征向量x,如果w⋅x+b>0, 那么样本为正类(+1),反之若w⋅x+b<0, 样本则属于负类(-1)。我们 引入符号函数sign(x),即
sign(x)={+1,x≥0

由此我们可以得到由输入空间到输出空间的函数
f(x)=sign(w⋅x+b)
这就叫做感知机,通过感知机模型,对于新输入实例给出其对应的输出类别。其中,w和b为感知机参数,w∈Rn叫做权值或权值向量,b∈R叫做偏置,w⋅x表示w和x的内积。感知机学习的目的就在于确定参数w和b的值。

3.感知机学习策略

给定一个线性可分的数据集:
T={ (x1,y1),(x2,y2),...(xN,yN)}T={ (x1,y1),(x2,y2),...(xN,yN)}
其中xi∈X=Rn,yi∈Y={+1,−1},i=1,2,3,…N 。

3.1. 点到超平面距离

为了确定感知机模型的参数w和b,需要确定一个学习策略,即定义一个损失函数并将损失函数极小化。感知机采用的损失函数为误分类点到超平面的总距离。首先写出输入空间Rn中任一点x0x0到分离超平面的距离:
1w|wx0+b|1‖w‖|w⋅x0+b|

这里w‖w‖ww L 2 范数。

3.2. 误分点到超平面距离

其次对于误分类的数据(xi,yi)(xi,yi)来说,yi(wxi+b)>0−yi(w⋅xi+b)>0
因为当wxi+b>0,yi=1w⋅xi+b>0,yi=−1,而当 wxi+b<0,yi=+1w⋅xi+b<0,yi=+1,
因此误分类点x_i到超平面的距离是:
1wyi(wxi+b)−1‖w‖yi(w⋅xi+b)

这样假设误分类点的集合为M,那么所有误分类点到超平面的总距离为:
1wxiMyi(wxi

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值