文章目录
一、前言
逻辑回归起源于线性回归
当数据点处于线性可分时,我们可以使用一条直线将其分开,而分割线的函数为:
(1) f ( x ) = w 1 x 1 + w 2 x 2 + ⋯ + w n x n + b = W X + b f(x) = w_1x_1+w_2x_2+ \cdots +w_nx_n + b = WX+b \tag{1} f(x)=w1x1+w2x2+⋯+wnxn+b=WX+b(1)
那么,怎样判定这个数据点属于哪一个类别呢?
可以通过函数进行划分,比如:sign
函数
(2) s i g n ( x ) = { + 1 , if x ≥ 0 − 1 , if x < 0 sign(x) = \begin{cases}+1, & \text{if } x \geq 0\\-1, & \text{if } x < 0\end{cases} \tag{2} sign(x)={ +1,−1,if x≥0if x<0(2)
那么,当 (1)
和 (2)
组合起来,就成了感知机,如:
(3) f ( x ) = s i g n ( w ∗ x + b ) f(x) = sign(w*x +b) \tag{3} f(x)=sign(w∗x+b)(3)
二、感知机
(1)那,什么是感知机呢?
在线性回归的基础上,将数据点进行划分,并判定这个数据点属于哪一个类别。
so,感知机计算流程图如下:
(2)感知机的损失函数
如何减少误分类情况呢?
通常会使用误分类点到分割线(面)的距离去定义损失函数
点到直线的距离
对于 n n n 维实数向量空间中任意一点 x 0 x_0 x0 到直线 W ∗ x + b = 0 W*x+b=0 W∗x+b=0 的距离为:
(4) d = 1 ∥ W ∥ ∣ W ∗ x 0 + b ∣ d= \dfrac{1}{\parallel W\parallel}|W*x_{0}+b| \tag{4} d=∥W∥1∣