度量学习DML之Lifted Structure Loss

原创已于 2024-02-02 20:04:05 修改 · 3.4k 阅读

15 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习

于 2021-12-26 17:44:09 首次发布

深度学习同时被 3 个专栏收录

83 篇文章

订阅专栏

度量学习

13 篇文章

订阅专栏

DML

10 篇文章

订阅专栏

这篇博客探讨了深度度量学习（DML）中的各种损失函数，包括ContrastiveLoss、TripletLoss、LiftedStructureLoss、CircleLoss、Cross-BatchMemory和MoCO等。LiftedStructureLoss是通过同时考虑mini-batch中所有负样本对来改进优化性能，避免了仅选择单个负样本的问题。博主还介绍了数据增强技术如SpecAugment和MixUp对模型性能的影响，并提供了基于pytorch-metric-learning的度量学习模板代码。文章强调了度量学习的目标是使同类样本的embedding距离更小，同时保持对未见过样本的有效表示。

部署运行你感兴趣的模型镜像

度量学习DML之Contrastive Loss及其变种_程大海的博客-优快云博客

度量学习DML之Triplet Loss_程大海的博客-优快云博客

度量学习DML之Lifted Structure Loss_程大海的博客-优快云博客

度量学习DML之Circle Loss_程大海的博客-优快云博客

度量学习DML之Cross-Batch Memory_程大海的博客-优快云博客

度量学习DML之MoCO_程大海的博客-优快云博客

数据增强之SpecAugment_程大海的博客-优快云博客

数据增强之MixUp_程大海的博客-优快云博客

基于pytorch-metric-learning实现的度量学习模板代码：pytorch-metric-learning-template

度量学习的目标：

相似的或者属于同一类的样本提取到的embedding向量之间具有更高的相似度，或者具有更小的空间距离
对于out-of samples的样本，也就是未见过的样本，希望也能提取到有效的embedding，也就是模型的泛化能力更好

Lifted Structure Loss

论文：《Deep Metric Learning via Lifted Structured Feature Embedding》

核心思想：通过前面的介绍可以知道，Contrastive Loss和Triplet Loss在每次计算loss时，只能处理mini-batch两个或者三个样本，这极大的影响了算法的优化性能。如何让算法一次处理说个样本，比如给定一个positive样本，然计算这个positive的loss时，不像Contrastive Loss和Triplet Loss那样一次只选择一个negative，而是同时选择mini-batch中的所有negative来计算loss，这也是后续好多损失函数的优化方向。如下图所示：

Lifted Structure Loss的定义如下：

其中，表示mini-batch中所有正样本对positive-pair的数量，表示mini-batch中所有的负样本对negative-pair。上面两个公式是啥意思呢？先看第二个公式，表示由样本与mini-batch中其他所有样本组成的负样本对（负样本之间的距离越大效果模型越好，距离越小模型越不好）中embedding距离最小的那个，表示由样本与mini-batch中其他所有样本组成的负样本对中embedding距离最小的那个，就是计算和的所有负样本对中距离最小的那个样本，表示正样本对和之间embedding的距离。总结一下Loss的来源如下：