人工神经网络—感知器算法

感知器算法详解与收敛证明

最新推荐文章于 2025-12-01 17:07:41 发布

原创

最新推荐文章于 2025-12-01 17:07:41 发布 · 2.4k 阅读

49 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #机器学习 #人工智能 #深度学习

本文介绍了感知器算法的起源、实现步骤、基于增广向量的算法以及其收敛定理。通过MATLAB程序演示，展示了在训练数据线性可分时，感知器算法如何确保收敛，并探讨了线性不可分时的收敛性问题。

感知器算法

1. 回顾
2. 感知器算法
3. 感知器算法收敛的MATLAB程序演示
参考资料

在这一讲中，我们将重点介绍美国科学家Frank Rosenblatt(1928-1971)如何对神经元的MP模型进行改造，用于解决二分类的问题。

图1 Frank Rosenblatt(1928-1971)

1. 回顾

回顾上一讲的内容，神经元的MP模型：

神经元生理结构示意图

图2 神经元生理结构示意图

神经元的数学模型示意图

图3 神经元的数学模型示意图

它的输出
在这里插入图片描述

2. 感知器算法

1957年，Frank Rosenblatt从纯数学的度重新考察这一模型，指出能够从一些输入输出对(X,y)中通过机器学习算法自动获得权重W和偏置b，以此，他提出感知器算法(Perceptron Algorithm)。

2.1 感知器算法的实现步骤

这里我们仍然假设输入的样本表示为给定一些输入输出对( $X_i$ , $y_i$ )， $i$ =1~N，这是一个二分类问题，其中， $X_i$ 是训练数据； $y_i=±1$ ，分别代表相应的类别。

我们的任务是要找一个向量W和一个常数b，使得对 $i = 1 \cdot \cdot \cdot N$ ，有
（1） $y_i=+1$ ，则 $W^TX_i+b>0$
（2） $y_i=-1$ ，则 $W^TX_i+b<0$
把某个训练数据 $X_i$ 满足上述的条件，叫作这个数据获得了平衡，否则没有获得平衡。可见，一个数据 $X_i$ 没有获得平衡也有两种情况：
（1） $y_i=+1$ ，则 $W^TX_i+b<0$
（2） $y_i=-1$ ，则 $W^TX_i+b>0$
可以看到，这个任务与前面支持向量机的任务完全一致。

我们已经学习过，当且仅当在训练数据集线性可分的情况下，才能找到W和b满足使所有的 $n$ 个训练样本都达到平衡，感知器算法给出了另一种不同于支持向量机寻找W和b的方法，其做法包含如下四个步骤：
（1）随机选择W和b。
（2）取一个训练样本(X,y)
(i) 若 $W^TX+b>0$ 且 $y = - 1$ ，则：
$w = W - X, b = b - 1$
(ii) 若 $W^TX+b<0$ 且 $y = + 1$ ，则：
$w = W + X, b = b + 1$
（3）再取另一个(X,y) ，回到（2）
（4）终止条件：直到所有输入输出对都不满足（2）中(i)和(ii)之一，退出循环