tensorflow.nn.softmax实现方式

最新推荐文章于 2023-02-04 03:23:37 发布

原创

最新推荐文章于 2023-02-04 03:23:37 发布 · 2.1k 阅读

1 ·

CC 4.0 BY-SA版权

在使用TensorFlow训练模型时遇到损失(loss)变为NaN的问题，怀疑与softmax归一化后对0取对数有关。通常softmax计算会减去序列最大值以避免0导致的对数问题。虽然在查看源码时未直接发现该操作，但根据文档注释和实际测试，证实tf.nn.softmax确实执行了减去序列最大值的步骤，确保数值稳定性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

跑模型的时候遇到loss为nan的情况，图里面有对softmax归一化后的值取对数的操作，担心是这里算出来0。一般softmax的计算会减去序列的最大值。即

 tf.exp(logits - tf.reduce_max(logits))  / tf.reduce_sum(tf.exp(logits - tf.reduce_max(logits)))

但是看tf源码没看懂哪里在做这个运算，但是注释文档里写的这样算的：

def softmax(logits, dim=-1, name=None):
 '''
    Computes softmax activations.
    This function performs the equivalent of

    softmax = tf.exp(logits) / tf.reduce_sum(tf.exp(logits), dim)
  '''

不敢相信，毕竟减序列最大值是常规操作，所以测了一下看到底是怎么算的。

(Pdb) x = [1.0,1.0, 100.0]

(Pdb) y = sess.run([(tf.exp(x-tf.reduce_max(x

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

沉心修炼

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

对TensorFlow中tf.nn.softmax()函数机器损失函数的理解

拼命先生的AI之旅

02-15

4578

Softmax函数，或称归一化指数函数，是逻辑函数的一种推广。它能将一个含任意实数的K维向量A “压缩”到另一个K维实向量 A' 中，使得A' 每一个元素的范围都在（0,1）之间，并且所有元素的和为1。该函数的形式可以按下面的式子给出：可能大家一看到公式就有点晕了，别被吓跑，我来简单解释一下。这个公式的意思就是说得到的A'向量中的每个元素的值，是由A中对应元素的指数值除以A中所有元素的...

笔记 - tensorflow用法：tf.nn.softmax的用法

chen_holy的博客

05-11

3735

思考 y_pred = tf.nn.softmax(tf.matmul(x, W) + b) """ softmax函数中输入是什么，输出是什么 """ 要理解输入输出是什么的先决条件：理解softmax的过程 softmax函数本质是一种非线性变化 ############## 占坑，下次更新用图说话 ################## import tensorflow as...

参与评论您还未登录，请先登录后发表或查看评论

tensorflow常用函数之tf.nn.softmax

12-13

1214

文章来源:http://www.datacups.com/post/35 关于softmax的详细说明，请看Softmax。通过Softmax回归，将logistic的预测二分类的概率的问题推广到了n分类的概率的问题。通过公式可以看出当月分类的个数变为2时，Softmax回归又退...

TensorFlow中的tf.nn.softmax_cross_entropy_with_logits_v2函数详解

信小海

11-21

2281

TensorFlow中的tf.nn.softmax_cross_entropy_with_logits_v2函数详解

【TensorFlow】TensorFlow函数精讲之tf.nn.softmax_cross_entropy_with_logits

中科院AI算法工程师的博客

11-18

914

tf.nn.softmax_cross_entropy_with_logits()函数是TensorFlow中计算交叉熵常用的函数。后续版本中，TensorFlow更新为：tf.nn.softmax_cross_entropy_with_logits_v2 格式为： cross_entropy = tf.nn.softmax_cross_entropy_with_logits(label...

TensorFlow tf.nn.softmax_cross_entropy_with_logits的用法

01-20

在计算loss的时候，最常见的一句话就是tf.nn.softmax_cross_entropy_with_logits，那么它到底是怎么做的呢？首先明确一点，loss是代价值，也就是我们要最小化的值 tf.nn.softmax_cross_entropy_with_logits(logits,...

【TensorFlow】关于tf.nn.sparse_softmax_cross_entropy_with_logits（）

热门推荐

ZJRN1027的博客

05-04

5万+

tf.nn.sparse_softmax_cross_entropy_with_logits() 这是一个TensorFlow中经常需要用到的函数。官方文档里面有对它详细的说明，传入的logits为神经网络输出层的输出，shape为[batch_size，num_classes]，传入的label为一个一维的vector，长度等于batch_size，每一个值的取值区间必须是[0，num_cla...

tensorflow 的 softmax

qq_29007291的博客

07-19

736

对于tensorflow中的一些softmax的一些总结 softmax的简单说明： [x1,x2,x3]⟶softmax⟶[ex1,ex2,ex3]ex1+ex2+ex3[x1,x2,x3]⟶softmax⟶[ex1,ex2,ex3]ex1+ex2+ex3\left[ x_1,x_2,x_3\right] {\longrightarrow} {softmax} {\longrightarro...

跟我学算法-吴恩达老师（超参数调试, batch归一化, softmax使用，tensorflow框架举例）...

weixin_34004750的博客

09-28

338

1. 在我们学习中，调试超参数是非常重要的。超参数的调试可以是a学习率，（β1和β2，ε）在Adam梯度下降中使用, layers层数, hidden units 隐藏层的数目, learning_rate_dacay 学习率衰减, mini-batch size 每次迭代的样本数目当需要调节的参数的数目较多时，我们通常使用随机参数选择进行参数调节. 比如学习率的范围为0.0001 -...

tf.nn.softmax

qq_42316807的博客

04-24

177

tf.nn.softmax(logits, axis=None, name=None) 等效执行： softmax = tf.exp(logits) / tf.reduce_sum(tf.exp(logits), axis) Args: logits：一个非空的Tensor。必须是下列类型之一：Tensor half float32 float64 axis：将在该维度上执行softmax。默认...

tf.nn.softmax详解（附代码实例）

lllxxq141592654的博客

05-20

6910

官网链接：https://tensorflow.google.cn/api_docs/python/tf/nn/softmax tf.nn.softmax( logits, axis=None, name=None, dim=None # 废弃 ) logits是一个张量，数据类型必须是half, float32, float64 softmax=elogits...

tensorflow中的tf.nn.softmax()和tf.reduce_sum()，tf.reduce_mean()

zgj_gutou的博客

01-20

596

tf.softmax()比较好理解，就是求各个值的比重，看下面程序的例子就知道了。 tf.reduce_sum()，tf.reduce_mean()常出现的地方例如： cross_entropy = tf.reduce_mean(-tf.reduce_sum(y_ * tf.log(y), reduction_indices=[1])) 从reduce_sum的源码定义中看，def reduce...

为什么softmax函数需要减去一个max值

lcczzu的专栏

03-28

1997

背景：在softmax函数对vector值进行计算，转换为[0, 1]区间的概率值的时候，往往会先对vector中每个元素减去一个max(vector)值。本文主要记录下对神经网络学习中，关于softmax函数计算的track背后的原因。 Softmax函数介绍首先来看一下softmax函数的公式：可以看到，softmax函数对vector处理的主要目的就是将vecto...

tensorflow_softmax代码解析

07-29

292

## 步骤 ### 开启 InteractiveSession import tensorflow as tf sess = tf.InteractiveSession() tensorflow依靠c++后端来计算。连接着后端的部分称为session。tensorflow的一般用法是，首先...

softmax函数计算时减去一个最大值的原因

benben044的专栏

09-02

1677

softmax深入理解

Tensorflow第三章线性神经网络Softmax回归实现

weixin_40473318的博客

02-04

216

动手深度学习dive into deep learning Tensorflow第三章线性神经网络Softmax回归实现

tensorflow训练出现nan的讨论

ljhandlwt

08-17

6744

本文讲述tensorflow训练时出现nan的原因,及其解决办法

tensorflow 运行过程中loss出现 NaN

tiandd12的博客

10-26

4067

描述：在训练的是loss正常，测试的时候出现了NaN 解决方法：通过打印softmax()之后的结果，发现出现了0值，导致后面出现log(0)=NaN的情况; 参考链接：http://stackoverflow.com/questions/33712178/tensorflow-nan-bug http://blog.csdn.net/sinat_16823063/article/d

tf.nn.softmax与tf.layer.softmax有区别吗