《统计学习方法》——感知机

最新推荐文章于 2022-06-21 10:31:37 发布

原创最新推荐文章于 2022-06-21 10:31:37 发布 · 1.6k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #机器学习 #人工智能

统计学习方法专栏收录该内容

4 篇文章

订阅专栏

本文介绍了《统计学习方法》第二章中的感知机模型，包括感知机的学习策略、原始学习算法和对偶学习算法。感知机是一种线性分类模型，其损失函数与更新规则被详细阐述。文章还探讨了两种学习算法的收敛性，证明在训练集线性可分情况下，感知机能够找到正确分割训练集的超平面。

《统计学习方法》——第二章感知机

写在前面

最近终于有开始看《统计学习方法》了，毕竟无脑调参确实没有什么意义。一方面是作为看书的笔记，一方面作为比博客或许能起到一点参考作用吧。
希望可以日更。

感知机

由输入空间到输出空间的函数：
$sign(w\cdot x+b)$
称为感知机。
感知机是一种线性分类模型，属于判别模型。

感知机的学习策略

感知机的损失函数：
$−1∥w∥∑xi∈Myi(w⋅xi+b)-\frac{1}{\Vert w\Vert} \sum_{x_{i}\in M}y_{i}(w\cdot x_{i}+b)$
注意：损失函数不需要考虑 $−1∥w∥-\frac{1}{\Vert w \Vert}$

感知机的学习算法

感知机其实有两种学习算法：

原始学习算法
对偶学习算法

原始学习算法

每次选取一个误分类点来进行更新。

输入：训练数据集T，学习率η。
输出：w, b; 感知机模型: $sign(w\cdot x+b)$ 。

过程：

选出初值 $w_{0}, b_{0}$ ;
在训练集中选取数据 $x_{i}, y_{i})$ ;
如果 $yi(w⋅xi+b)≤0y_{i}(w \cdot x_{i} + b)\leq 0$ ,
$w←w+ηyixiw\leftarrow w + \eta y_{i}x_{i}$
$b←b+ηyib\leftarrow b + \eta y_{i}$
移动到(2)，直到训练集中没有误分类点。

对偶学习算法

对偶形式的基本想法是，将w和b表示为实例和标记的线性组合的形式，通过求解其系数而求的w和b。在原始算法的基础上假设初始值为0。这样，最后学习到的w和b可以表示为：
$\sum _{i=1}^{N} \alpha_{i}y_{i}x_{i}$
$\sum _{i=1} ^{N} \alpha_{i}y_{i}$
其中 $αi=ηni\alpha_{i} = \eta n_{i}$ , $n_{i}$ 是第i个点误分类的次数。

输入：训练数据集T
输出： $α,b\alpha, b$ ; 感知机模型 $f(x)=sign(∑j=1Nαjyjxj⋅x+b)f(x)=sign(\sum _{j=1}^{N}\alpha _j y_j x_j \cdot x+b)$ , 其中 $α\alpha$ 是向量。
过程：

$a←0,b←0;a\leftarrow0, b\leftarrow0;$
在训练集中选择数据 $x_{i}, y_{i})$
若 $f(x)←0f(x)\leftarrow0$ ,
$αi←αi+η\alpha_{i} \leftarrow\alpha_{i}+\eta$
$b←b+ηyib\leftarrow b+\eta y_{i}$
转至(2)直到没有误分类的数据。