感知机模型

最新推荐文章于 2024-12-06 22:45:04 发布

原创最新推荐文章于 2024-12-06 22:45:04 发布 · 290 阅读

CC 4.0 BY-SA版权

文章标签：

定义:输入为 $x∈Rnx\in R^n$ ,输出为 $\in \{-1,1\}$ , $x$ 为空间的特征向量,对应于输入空间(特征空间)的点,输出的y表示实例的类别函数 $f (x) = s i g n (w * x + b)$ 称为感知机
$w∈Rnw\in R^n$ 称为权值向量(weight vector),b称为偏置(bias),
$\begin{cases} 1& \text {x>=0} \\ -1& \text {x<0} \end{cases}$

数据集 $T=\{(x_1,y_1),(x_2,y_2)...(x_n,y_n)\}$
对所有的 $y_i=1$ 都有 $w*x_i+b>0$ ,
对所有的 $y_i=-1$ 都有 $w*x_i+b<0$
则称数据集 $T$ 可分

超平面

线性方程 $w*x_i+b=0$ 形成一个超平面, $b$ 称为超平面的截距,w为超平面的法向量

损失函数

点 $x_0$ 到超平面的距离为 $1∣∣w∣∣∣w∗x0+b∣\frac{1}{||w||}|w*x_0+b|$
$∣ ∣ w ∣ ∣$ 为 $w$ 的 $L_2$ 范数
$1∣∣w∣∣∣w∗xi+b∣>0\dfrac{1}{||w||}|w*x_i+b|>0$ 时, 误分类数据 $y_i=-1$
$1∣∣w∣∣∣w∗xi+b∣<0\dfrac{1}{||w||}|w*x_i+b|<0$ 时, 误分类数据 $y_i=+1$
所以误分类数据 $x_i,y_i)$ 到超平面的距离为
$−yi∣∣w∣∣(w∗xi+b)-\dfrac{y_i}{||w||}(w*x_i+b)$
取损失函数 $L(w,b)=−∑xi∈Myi(w∗xi+b)L(w,b)=-\sum_{x_i \in M} y_i(w*x_i+b)$ ,其中 $M$ 为误分类点的集合
$L (w, b)$ 的两个偏导
$∂L∂w=−∑xi∈Myi∗xi\frac{\partial L}{\partial w}=-\sum_{x_i \in M} y_i*x_i$
$∂L∂b=−∑xi∈Myi\frac{\partial L}{\partial b}=-\sum_{x_i \in M} y_i$