机器学习算法(分类算法）—Rosenblatt感知机

最新推荐文章于 2025-05-11 14:08:35 发布

原创最新推荐文章于 2025-05-11 14:08:35 发布 · 1.1k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

机器学习和深度学习专栏收录该内容

38 篇文章

订阅专栏

本文介绍了感知机这一基本的二类分类线性模型，探讨了其概念、训练过程及实现方式。感知机通过调整权重和偏置来寻找最优的分隔超平面，文中还提供了具体的MATLAB实现代码。

一、感知机的概念

感知机是一种二类分类的线性模型，输入实例的特征向量，输出为实例的类别，即+1或者-1。感知机模型是神经网络和支持向量机的基础。

假设特征为 $X\in R^{n}$ ，类标签为 $y\in \left \{ -1,+1 \right \}$ ，由特征到类标签的映射可以表示为

$f\left ( x \right )=sign\left ( w\cdot x+b \right )$

这样的函数称为感知机。其中 $w$ 和 $b$ 为感知机的参数， $w$ 为权重， $b$ 为偏置。 $w\cdot x$ 为向量 $w$ 与向量 $x$ 之间的内积。 $sign$ 为符号函数：

$sign=\left\{\begin{matrix} +1, & x\geqslant 0 \\ -1, & x< 0 \end{matrix}\right.$

$w\cdot x+b=0$ 为分隔超平面。

二、感知机模型的训练

1、目标函数

为了能够正确的对实例分类，我们的目标是能够求出分隔超平面，即求出参数 $w$ 和 $b$ 。在这里，分隔超平面存在的前提是数据集是线性可分的。

在训练参数 $w$ 和 $b$ 时，我们可以采用损失函数，并且使得损失函数最小化。感知机的训练中损失函数可以采用误分类点到分隔超平面的距离的总和。一个点被正确分类是指当 $w\cdot x+b\geqslant 0$ 时，而原始标签 $y=-1$ ；类似的，当 $w\cdot x+b< 0$ 时，而原始标签 $y=+1$ 。一个点到平面之间的距离公式为

$\frac{1}{\left \| w \right \|}\left | w\cdot x+b \right |$

对于误分类点 $\left ( x_i,y_i \right )$ ，有 $-y_i\left ( w\cdot x_i+b \right )> 0$ ，因此误分类点到分隔超平面之间的距离为

$\frac{-y_i}{\left \| w \right \|}\left ( w\cdot x_i+b \right )$

可以不考虑 $\frac{1}{\left \| w \right \|}$ ，则对于误分类点集合 $M$ ，感知机的损失函数为

$L\left ( w,b \right )=-\sum_{x_i\in M}y_i\left ( w\cdot x_i+b \right )$

我们的目标使得损失函数最小化，即 $min L\left ( w,b \right )$ 。我们可以使用梯度下降法求解这样的最小化问题。（梯度下降法），在这里我们采用梯度下降法的改进算法：随机梯度下降法。

2、感知机的训练过程

随机选取权重和偏置的初值 $w_0$ 和 $b_0$
随机选取初始实例 $\left ( x,y \right )$
如果 $y\left ( w\cdot x+b \right )\leqslant 0$ ， $w\leftarrow w+\alpha yx$ ， $b\leftarrow b+\alpha y$ 。
转至2，直到训练集中没有误分类点。

三、实例

选自《统计学习方法》，训练集为：正实例点是 $x_1=\left ( 3,3 \right )^T$ ， $x_2=\left ( 4,3 \right )^T$ ，负实例点是 $x_3=\left ( 1,1 \right )^T$ 。

原始点集

MATLAB代码

[plain] view plain copy

分类结果

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。