力求以通俗易懂的方式将感知机解释明白
1.数据集的线形可分性
假设有这么一个数据集
T={
(x1,y1),(x2,y2),···(xn,yn)} T = { ( x 1 , y 1 ) , ( x 2 , y 2 ) , · · · ( x n , y n ) }
其中,x~i~ ∈ ∈ R^n^ ,y~i~ ∈ ∈ {-1,+1}
感知机的作用就是找到一个超平面 S S
能够将数据集的正实例(也就是+1)和负实例分开。对所有 y2=+1 y 2 = + 1 的实例i,有 w·xi+b>0 w · x i + b > 0
对所有 yi=−1 y i = − 1 的实例i,有 w·xi+b<0 w · x i + b < 0 。
如果能够将所有的实例分开,那就称数据集 T T 线性可分,否则就不可分
2.感知机学习策略
感知机就是要找到这么一个超平面,将正负实例分开,则就需要确定超平面的w,b。这里我们引进损失函数的概念,损失函数的一个想当然的选择就是误分类点的个数,我们总期望是误分类点的个数最少,即