统计机器学习第二章 感知机

本文深入解析感知机算法,包括其基本原理、线性方程w*x+b=0对应的超平面概念,以及如何通过迭代更新权重w和偏置b来实现数据分类。探讨了算法的原始形式与对偶形式,以及Gram矩阵的运用,旨在帮助读者理解感知机在机器学习中的应用。

对于线性方程w*x+b = 0

对应于空间的一个超平面S,其中w是超平面的法向量,b是超平面的截距。超平面将空间划分为两个部分,位于平面两边的点分属于正负两类。

前提:数据线性可分,可以找的一个超平面S,w*x+b = 0,能够将数据完整划分开。

输入:{(x1,y1),(x2,y2),..(xN,yN),},其中yi={-1,1}

输出:w和b。

算法的原始形式:

  1. 选取初始值w0和b0
  2. 在数据集中选择数据 (xi,yi)
  3. 如果yi(wix+b)<=0, w←w+ηyixi  b←b+ηyi
  4. 转到步骤2直到没有误分类点

经过有限次搜索可以找到这个分类面,不唯一,与初值选择,误分类点的选择顺序等有关。

感知机对偶,

对原始形式做变形,

w = η(y1x1+y2x2+  +yixi) ,假设ni 是这些数据点第i个点在训练过程中被误分类的总次数,则有

w=∑niηyixi

如果令ai=niη,则有w=∑aiyixi,同理b=∑aiyi

算法的对偶形式:

取 a = (a1,a2,  aN)T

  1. 选取初始值a=0和b=0
  2. 在数据集中选择数据 (xi,yi)
  3. 如果yi∑(ajxj*xi+b)<=0, ai←aii  b←b+ηyi
  4. 转到步骤2直到没有误分类点
  5. 最后学习w和b可以表示为:w=∑aiyixi,b=∑aiyi

提前计算gram矩阵,降低运算量。

转载于:https://www.cnblogs.com/lancet1105/p/10341550.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值