线性分类
感知机
前提:线性可分
思想:错误驱动
模型: f ( x ) = s i g n ( ω T x ) f(x)=sign(\omega^Tx) f(x)=sign(ωTx), D = { 被 错 误 分 类 的 样 本 集 合 } D=\{被错误分类的样本集合\} D={被错误分类的样本集合}
样本集: { ( x i , y i ) } i = 1 N \{(x_i,y_i)\}_{i=1}^N {(xi,yi)}i=1N
策略: l o s s f u n c t i o n ⇒ L ( ω ) = ∑ i = 1 N I { y i ω T x < 0 } loss\ function\Rightarrow L(\omega)=\sum_{i=1}^NI\{y_i\omega^Tx<0\} loss function⇒L(ω)=∑i=1NI{yiωTx<0},小于0表示分类错误
判断是否分类正确的表示:
易知
y
i
ω
T
x
<
0
{y_i\omega^Tx<0}
yiωTx<0是一个关于
w
w
w的一个连续函数(错误驱动思想就是不断的微小的调整
w
w
w,以此来达到降低错误或者减少损失函数的数值),所以可导,那么改写为:
l
o
s
s
f
u
n
c
t
i
o
n
⇒
L
(
w
)
=
∑
x
i
⊂
D
−
y
i
w
T
x
i
loss\ function\Rightarrow L(w)=\sum_{x_i\subset D}-y_iw^Tx_i
loss function⇒L(w)=xi⊂D∑−yiwTxi
对
w
w
w求导:
∇
w
L
=
−
y
i
x
i
\nabla_wL=-y_ix_i
∇wL=−yixi
由梯度下降法有:
w
t
+
1
=
w
t
−
λ
∇
w
L
=
w
t
+
λ
y
i
x
i
w^{t+1}=w^{t}-\lambda\nabla_wL=w^{t}+\lambda y_ix_i
wt+1=wt−λ∇wL=wt+λyixi