2.机器学习基石 | 感知器_贪心算法和口袋算法-优快云博客

本文链接：https://blog.youkuaiyun.com/qq_41058526/article/details/82190928

博客主要介绍了用于线性二分类的感知器及PLA算法，阐述了PLA算法从假设空间找g的目标和方法，通过举例说明其调整分界面的过程，分析了PLA的终止条件、优缺点，还提出用口袋算法解决PLA在数据有噪声时的停止问题。

Perception 感知器（用于线性二分类）

Alt text

PLA算法 : 怎样从假设空间 $H$ 中找到 $g$

1.目标：g 约等于 f，最好的结果，但是f未知此方法不行

2.目标：使得在给定数据上两者预测结果接近
Alt text

3.感知器优化算法（PLA）

Alt text

上述公式的理解：
（1）y是正的，出来结果w是负的

通过w+x，将w拉回来一点（作为新的分界面法向量，此图中黑色x为原分界面法向量）

（2）y是负的，出来结果w是正的

通过w+x，将w拉过去一点

举例：

（1）最开始没有线
Alt text

（2）默认每个点都是错的，找到任意一点与原点连线（原点在图中间），而这个点刚好为正（圈为正，叉为负），即为分界面的法向量

（3）
黑点为分类错误的点，与原法向量相加，产生紫色线，即可以调整分界面，紫色作为新的法向量，如此持续，直到没有分类错误
Alt text

思考：

通过一次的调整，可以使得错误的点偏向正确一点点，但不是完全保证一定正确

PLA终止条件

1.PLA保证：数据必须线性可分
Alt text

2.PLA条件1：线性可分

3.PLA条件2：有错才更新

结合条件1和2的结论：令

则由（1）得：
对于第T次更新，
$wfT∗wT>wfT∗w0+T∗ρ∗∣∣wf∣∣=T∗ρ∗∣∣wf∣∣w_f^T*w_T > w_f^T*w_0+T*\rho*||w_f|| = T*\rho*||w_f||$
(因为 $w_0=0$ )

由（2）得：

对于第T次更新，
$wfT∗wT>wfT∗w0+T∗ρ∗∣∣wf∣∣=T∗ρ∗∣∣wf∣∣w_f^T*w_T > w_f^T*w_0+T*\rho*||w_f|| = T*\rho*||w_f||$
从而(1)结果除以(2):
$wfT∗wT∣∣wT∣∣)>T∗ρ∗∣∣wf∣∣T∗R\frac{w_f^T*w_T}{||w_T||})> \frac{T*\rho*||w_f||}{\sqrt{T}*R}$