两种softmax loss求取的代码

最新推荐文章于 2024-03-18 16:08:35 发布

原创最新推荐文章于 2024-03-18 16:08:35 发布 · 759 阅读

0 ·

CC 4.0 BY-SA版权

本文介绍了两种计算交叉熵损失的方法，并对比了它们的计算效率。第一种方法直接从概率分布中提取正确类别的概率并计算其对数，第二种方法则通过构建指示矩阵并用作掩码来实现相似的目标。

#1. probs[range(N), y] 从probs中取出y所指向的正确类的概率值，然后对各元素求log值，得到correct_logprobs，是一个[N,]数组：

correct_logprobs = -np.log(probs[range(N), y])

data_loss = np.sum(correct_logprobs) / N

#2.建立 y_trueClass矩阵，将正确分类的位置上赋值为1,其余为0。对probs中的元素取log之后，将y_trueClass作为mask，来从probs中剔除非正确分类的概率值，求和，取平均。

y_trueClass = np.zeros_like(probs)

y_trueClass[range(num_train), y] = 1.0

loss += -np.sum(y_trueClass * np.log(probs)) / num_train

个人认为第一种较好，计算量小。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

flashlau

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

softmax loss 系列记录

Lyang-Never

03-18

492

一、前言最近看人脸识别方面的内容，遇到了好多个损失函数，在这里先记录下，不作太深的挖掘。二、主要内容 2.1、Softmax loss 其公式如下：其中，N表示训练数据的数量。fjf_jfj代表 class scores fff的第j个元素。也是全连接层的输出，所以fjf_jfj可以写为： fj=WyiTxif_j = W^T_{y_i}x_i fj=WyiTxi 用模的形式...

面部识别算法中的损失函数A-softmax loss详解

sinat_36618660的博客

08-25

3046

论文1：SphereFace: Deep Hypersphere Embedding for Face Recognition 论文2：ArcFace: Additive Angular Margin Loss for Deep Face Recognition (一)、原始的（普通的）Softmax函数是什么？在数学，尤其是概率论和相关领域中，Softmax函数，或称归一化指数函数，是逻辑函数...

参与评论您还未登录，请先登录后发表或查看评论

caffe源码学习:softmaxWithLoss前向计算

HAHA的专栏

08-04

1万+

caffe源码学习:softmaxWithLoss 在caffe中softmaxwithLoss是由两部分组成，softmax+Loss组成，其实主要就是为了caffe框架的可扩展性。表达式（1）是softmax计算表达式，（2）是sfotmaxLoss的计算损失表达。在caffe中是单独的计算每层的输入和输出，然后再进行向后传递data结果和向前传递diff的结果。

MatConvNet之softmaxloss原理及其代码实现

鹊踏枝-码农的专栏

01-21

1126

在卷积神经网络ConvNets中，前向传播到最后一层计算网络预测标签（predicted label）与真实标签（Ground Truth）之间的误差，需要定义一个损失函数，如Log loss，Softmax log loss，Multiclass hinge loss，Multiclass structured hinge loss等，本文要讲的就是Softmax log loss损失函数在Co

Matconvnet框架中采用自己的softmaxloss损失函数代码

zyqdragon的博客

06-17

2188

Matconvnet框架中采用自己的softmaxloss损失函数代码。主要涉及的模块是vl_nnsoftmaxloss函数和processEpoch函数。vl_nnsoftmaxloss函数中实现了自己的softmaxloss代码，相关的算法推导请见softmaxloss损失函数的算法推导，注意进行softmaxlos的相关计算前要减去神经网络输出的最大值。processEpoch函数中的[im

def softmax_loss_vectorized(W, X, y, reg): loss = 0.0 dW = np.zeros_like(W) N = X.shape...

weixin_35755188的博客

01-06

170

这是一个实现softmax损失函数的向量化版本的Python代码。参数： W：权重矩阵，形状为(D, C)，其中D是特征数，C是类别数 X：输入数据，形状为(N, D)，其中N是样本数 y：标签，形状为(N,) reg：正则化系数返回值： loss：损失值 dW：W的梯度代码流程：初始化损失为0，dW为0矩阵计算输入数据的特征数N和分类数C 计算f = X * W，其中f的形...

Softmax与SoftmaxWithLoss原理及代码详解

Sundrops的专栏

07-29

7264

一直对softmax的反向传播的caffe代码看不懂，最近在朱神的数学理论支撑下给我详解了它的数学公式，才豁然开朗 SoftmaxWithLoss的由来 SoftmaxWithLoss也被称为交叉熵loss。回忆一下交叉熵的公式，H(p,q)=−∑jpjlogqjH(p,q)=−∑jpjlog⁡qjH(p, q) = -\sum_j p_j\log q_j，其中向量 ppp是原...

一文讲懂召回中的 NCE & NEG & sampled softmax loss

眼罩的程序员笔记

07-11

2940

Tensorflow的负采样函数Sampled softmax loss踩坑之旅

chutongz的博客

04-04

8664

谷歌16年出的论文《Deep Neural Networks for Youtube Recommendation》中提到文章采用了负采样的思想来进行extreme multiclass分类任务 Tensorflow提供了两种负采样，分别是NCE loss 和Sampled softmax loss，两者最大的区别就是针对的任务不同，代码实现上两者也只有最后的loss函数不同，两者用的采样函数及算...

softmax loss pytorch

最新发布

04-26

softmax loss是一种常用的损失函数，它主要用于多分类任务中，特别适用于神经网络模型的训练。在PyTorch中，可以使用torch.nn.CrossEntropyLoss来实现softmax loss。 softmax loss的目标是将输入的预测概率分布与...

一文看懂softmax loss

自己在学习过程中的总结

03-18

4018

本文针对softmax函数、交叉熵损失函数、softmax loss损失函数（重点）、带有temperature参数的softmax loss进行了详细的讲解，目的是更好的理解softmax loss。

CS231n笔记1--Softmax Loss 和 Multiclass SVM Loss

u012767526的专栏

05-13

8637

Softmax Loss 和 Multiclass SVM LossSoftmax Loss给出（xi,yi）（x_i, y_i），其中 xix_i 是图像，yiy_i 是图像的类别（整数），s=f（xi,W）s = f（x_i,W），其中ss 是网络的输出，则定义误差如下： P(Y=k|X=xi)=esk∑jesjLi=−logP(Y=yi|X=xi)P(Y = k|X = x_i) =

人脸识别的LOSS（多分类Softamx）

爱破破爱科研

09-04

5962

人脸1：N应用：https://blog.youkuaiyun.com/intflojx/article/details/81278330 超多分类的Softmax 早期深度人脸识别方法，框架为CNN + Softmax，以“超多分类”这样一种比较难的任务训练CNN，强迫网络在第一个FC层形成比较紧凑的，判别力很强的深度人脸特征，之后用于人脸识别。 Softmax优缺点 Softmax是soft（...

Loss(三)-2017：Large-Margin Softmax Loss【Margin：角度分类边界之间的空白角度区域；增大该区域可提高分类精度；缺陷：无法处理W_i≠W_j情况，训练不稳定】

u013250861的博客

08-18

954

尽管传统的softmax在卷积网络作为最常用的监督学习组件，但是他不能促进判别性强的特征的学习，在这篇论文里面首先提出一种基于Margin的L-Softmax损失函数，可以明确地促使学习到的特征具有类内的紧凑性和类间的可分离性。此外L-Softmax不仅可以调节所需的Margin，还可以避免过拟合的发生。这个损失函数可以通过经典的随机梯度下降算法优化。Large-Margin Softmax Loss（L-Softmax Loss）是为了提高类内特征的紧凑性，拉大类间特征的间隔（intra-class co

Large-Margin Softmax Loss for Convolutional Neural Networks

weixin_37958272的博客

07-07

854

Large-Margin Softmax Loss for Convolutional Neural Networks 在本文中，我们将软最大损耗定义为交叉熵损耗、软最大函数和最后一个完全连接层的组合（见图1）。在这种定义下，许多流行的CNN模型可以被视为卷积特征学习组件和softmax损失组件的组合，如图1所示。尽管它的流行，当前的软最大损失并不明确鼓励类内的紧密性和类间的可分离性。我们的主要直觉是，样本和参数之间的可分性可以分解为具有余弦相似性的幅值和角值: 其中c是类索引，最后一个完全连接层的

Softmax loss 之 Large Margin Softmax(L-softmax)

caicai的博客

09-28

1699

关于softmax、softmaxloss的详细介绍可见于：https://blog.youkuaiyun.com/u014380165/article/details/77284921 large margin softmax论文中说道，softmax+cross-entropy loss是CNNs中最为常见的代价组合，效果不错，但是没有对特征有区别的学习。所以论文基于它提出L-Softmax，强化特征的类内紧凑和类间疏离。 Softmax loss 1. 定义 Gamma公式展示 Γ(n)=(n−1)!∀n∈N\G

Large-Margin Softmax Loss

小花生的博客

05-06

2086

Large-Margin Softmax Loss 参考：https://zhuanlan.zhihu.com/p/34044634 https://zhuanlan.zhihu.com/p/35027284 https://zhuanlan.zhihu.com/p/34404607 Liu W, Wen Y, Yu Z, et al. Large-Margin Softmax Loss for...

SphereFace算法详解