机器学习基石notes-Lecture2 Learning to Answer Yes/No

感知机模型详解

最新推荐文章于 2025-11-24 15:59:30 发布

原创最新推荐文章于 2025-11-24 15:59:30 发布 · 579 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

笔记同时被 2 个专栏收录

4 篇文章

订阅专栏

机器学习基石

2 篇文章

订阅专栏

本文深入解析了感知机模型的工作原理及学习算法。感知机是一种基本的二分类模型，通过计算特征向量与权值向量的内积并与阈值比较来做出预测。文章详细介绍了感知机的学习过程，包括权重更新规则及其收敛条件。

感知机模型

对于一组特征向量 $X = (X_1,X_2,\cdots,X_d)$ ， ${\cal y}:{+1,-1}$ ，将特征向量与权值向量做内积，其计算结果与阀值作比较进而输出结果

${\mit h} \in {\cal H}$

h (X) = s i g n ((\sum i = 1 d W i X i) - t h r e s h o l d) = s i g n ⎛ ⎝ ⎜ (\sum i = 1 d W i X i) + (- t h r e s h o l d)                W 0 \cdot (+ 1)      X 0 ⎞ ⎠ ⎟ = s i g n (\sum i = 0 d W i X i) = s i g n (W T X)

$\begin{align} {\mit h}(X) & = sign\left(\left(\sum_{i=1}^d { {W_i} {X_i} }\right) - threshold\right) \\ & = sign\left(\left(\sum_{i=1}^d { {W_i} {X_i} }\right) + \underbrace{(-threshold)}_{W_0}\cdot\underbrace{(+1)}_{X0}\right) \\ & = sign\left(\sum_{i=0}^d { {W_i} {X_i} }\right) \\ & = sign({W^T}X) \end{align}$

例：在二维空间中，h函数表示为 ${\mit h}(X) = sign(W_0+{W_1}{X_1}+{W_2}{X_2})$
二维空间感知机模型
空间中的点表示特征向量，标签y表示输出值，O表示+1，x表示-1，空间中的线表示假设

感知机学习算法

通过不断修正的方式，初始化的 $W_0$ ，通过 ${\cal D}$ 训练样本不断修正。

具体算法：

在 ${\mit t} = 0,1,\cdots$ 循环过程中

存在 $( {X_n(t)} , { {\mit y}_n(t)} )$ 在 $W_t$ 的规则下是错误的，即 $sign( {W_t^T}X_n(t) ) \not= {\mit y}_n(t)$
通过 $W_t+1 \leftarrow W_t + {\mit y}_n(t)X_n(t)$ 进行修正
直到没有错误返回 $W$ 为 ${\mit g}$

感知机算法修正示意图

实际上W即为分割线的法向量，sign即为X在W方向上的分量与W是同向还是反向。

感知机算法的收敛性

PLA数据线性可分

假设 ${\cal D}$ 是线性可分的，那么PLA是否一定会停止

非线性可分数据集

但是PLA的前提是指导数据集是线性可分的

数据集中普遍存在噪声

解决办法

找一个在已知数据集上犯错最少的线

初始化当前最优预测向量 $\hat{W}$ ，在 ${\mit t} = 0,1,\cdots$ 循环过程中

存在 $( {X_n(t)} , { {\mit y}_n(t)} )$ 在 $W_t$ 的规则下是错误的
通过 $W_t+1 \leftarrow W_t + {\mit y}_n(t)X_n(t)$ 进行修正
如果新的 $W_{t+1}$ 比 $\hat{W}$ 犯的错少，跟新 $\hat{W}$ 为 $W_{t+1}$
直到做了足够多次循环，返回 $\hat{W}$ 为 ${\mit g}$

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。