【机器学习】损失函数：Hinge Loss（max margin）

最新推荐文章于 2025-03-21 09:36:37 发布

qq280929090

最新推荐文章于 2025-03-21 09:36:37 发布

阅读量1.3k

点赞数

分类专栏： Machine Learning 文章标签：机器学习目标函数优化

Machine Learning 专栏收录该内容

6 篇文章

订阅专栏

本文介绍了HingeLoss损失函数，一种广泛应用于支持向量机(SVM)的目标函数。它旨在通过限制分类器对正确分类样本的过度自信来提高整体分类准确性。文章还探讨了HingeLoss的变种及其在训练词向量等场景中的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Hinge Loss简介

Hinge Loss是一种目标函数（或者说损失函数）的名称，有的时候又叫做max-margin objective。其最著名的应用是作为SVM的目标函数。

其二分类情况下，公式如下：

l (y) = m a x (0, 1 - t \cdot y)

其中，y是预测值（-1到1之间），t为目标值（

± 1）。

其含义为，y的值在-1到1之间就可以了，并不鼓励|y|>1，即并不鼓励分类器过度自信，让某个可以正确分类的样本距离分割线的距离超过1并不会有任何奖励。从而使得分类器可以更专注整体的分类误差。

变种

实际应用中，一方面很多时候我们的y的值域并不是[-1,1]，比如我们可能更希望y更接近于一个概率，即其值域最好是[0,1]。另一方面，很多时候我们希望训练的是两个样本之间的相似关系，而非样本的整体分类，所以很多时候我们会用下面的公式：

l (y, y') = m a x (0, m - y + y')

其中，y是正样本的得分，y’是负样本的得分，m是margin（自己选一个数）

即我们希望正样本分数越高越好，负样本分数越低越好，但二者得分之差最多到m就足够了，差距增大并不会有任何奖励。

比如，我们想训练词向量，我们希望经常同时出现的词，他们的向量内积越大越好；不经常同时出现的词，他们的向量内积越小越好。则我们的hinge loss function可以是：

l (w, w +, w -) = m a x (0, 1 - w T \cdot w + + w T \cdot w -)

其中，w是当前正在处理的词，

w+ 是w在文中前3个词和后3个词中的某一个词，

w− 是随机选的一个词。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。