机器学习-感知机

最新推荐文章于 2025-01-11 10:18:14 发布

原创

最新推荐文章于 2025-01-11 10:18:14 发布 · 566 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习 #感知机

感知机是1957年，由Rosenblatt提出，是神经网络和支持向量机的基础。感知机是二分类的线性分类模型，其输入为实例的特征向量，输出为实例的类别，取+1和-1二值。感知机对应于输入空间中将实例划分为正负两类的分离超平面，属于判别类型。
假设训练数据集是线性可分的，感知机学习的目标是求得一个能够将训练数据集正实例点和负实例点完全正确分开的分离超平面。如果是非线性可分的数据，则最后无法获得超平面。

感知机模型

感知机的输入特征向量x为n维向量，输出y∈{+1,-1}.
感知机从输入空间到输出空间的模型如下：
$\cdot {x}+b)$
其中 $w∈R^n$ 叫做权值， $b \in R$ 叫做偏置。
sign是符号函数，即：
$\begin{cases} -1& {x<0}\\ 1& {x\geq 0} \end{cases}$

感知机有如下几何解释：
线性方程w·x+b=0 对应于特征空间 $R^n$ 中的一个超平面S，其中w是超平面的法向量，b是超平面的截距。这个超平面将特征空间划分为两个部分。位于两部分的点分别被分为正、负两类。如下图所示：

在这里插入图片描述
感知机的学习目的就是确定最佳的w和b

数据集的线性可分性

给定一个训练集 $T={(x_1,y_1),(x_2,y_2),...,(x_N,y_N)}$ ，如果存在某个超平面S:w·x+b=0能够将数据集的正实例点和负实例点完全正确地划分到超平面的两侧，则称为该数据集T线性可分，否则称为线性不可分。

感知机学习策略

损失函数

感知机的损失函数采用误分类点到超平面S的总距离。

首先，写出输入空间中任意一点 $x_0$ 到超平面S的距离： $∣w⋅x0+b∣∣∣w∣∣\frac{|w\cdot {x_0}+b|}{||w||}$
其中，||w||是w的 $L_2$ 范数， $L_2$ 范数定义为向量所有元素的平方和的开平方。

对于误分类的数据( $x_i,y_i$ )来说， $−yi(w⋅xi+b)>0-y_i(w\cdot {x_i}+b)>0$ 成立
因为当 $w⋅xi+b>0w\cdot {x_i}+b>0$ 时， $y_i=-1$

最低0.47元/天解锁文章

评论 1

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。