Comparing between SVM and LR

最新推荐文章于 2024-04-24 14:48:31 发布

BogeyDa

最新推荐文章于 2024-04-24 14:48:31 发布

阅读量123

点赞数

分类专栏： Algorithm 文章标签： SVM支持向量 LR逻辑回归算法线性分类损失函数

本文链接：https://blog.youkuaiyun.com/lrglgy/article/details/88581894

版权

20 篇文章

订阅专栏

本文深入探讨了SVM和支持向量机在机器学习领域的异同。从线性分类模型的角度出发，分析了两者作为判别模型和监督学习算法的特点。详细比较了它们在损失函数、关注数据范围、处理非线性问题、正则化项等方面的区别。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

SVM与LR比较

LR与SVM都属于线性分类模型
当LR中的标签是离散的，则LR可被认为是分类算法；当不考虑核函数时，原始的LR与SVM都是线性分类器。
LR与SVM都属于判别模型
判别模型可以生成一个表示P(Y|X)的判别函数（预测模型），而生成模型会先计算联合概率P(X,Y),然后再利用贝叶斯公式计算条件概率。换句话说，判别模型不关心数据是怎么来的，只关心数据之间的差别，然后利用数据间差别进行分类。而生成模型关注数据是怎么来的，然后产生生成假设，根据假设判断数据最有可能来自哪个类别。
LR与SVM都属于监督学习算法

本质（损失函数）不同
LR的损失函数为 $J(\theta)=\frac{1}{n}\sum_{i=1}^n[y_i\log h_{\theta}(x_i)+(1-y_i)\log(1-h_{\theta}(x_i))].$
SVM的损失函数为 $\mathcal{L}(w,\alpha,b)=\frac{1}{2}|\omega|^2-\sum_{i=1}^n\alpha_i[y_i(\omega^Tx_i+b)-1].$
不同损失函数代表着不同的假设前提即分类原理。LR是基于概率理论，利用极大似然估计的方法求解。而SVM是基于几何间隔最大化，
LR关注全局数据，而SVM只关注边界线附近的局部数据
LR受全局数据的影响，而SVM只受边界线附近的局部数据即支持向量的影响，详情见下图：
处理非线性问题时，SVM会使用核函数，而LR不使用核函数
分类模型就是计算决策面，SVM中只有少数几个代表支持向量的样本参与核计算，而LR中所有样本都要参与计算。如果LR采用核函数，则产生的计算复杂度将非常高。
LR的损失函数中不包括正则项，而SVM中包含有正则项
添加正则化项可以平衡训练误差和训练复杂度，达到结构风险最小化的目的。 $\frac{1}{2}||\omega||^2$ 就是SVM中的L2正则化项。