1.4 神经网络输出层的设计

最新推荐文章于 2025-07-10 12:26:12 发布

eowyn0406

最新推荐文章于 2025-07-10 12:26:12 发布

阅读量1.7k

点赞数

CC 4.0 BY-SA版权

分类专栏：神经网络学习笔记文章标签： CNN 输出层设计 softmax

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/eowyn0406/article/details/85235578

神经网络学习笔记专栏收录该内容

11 篇文章

订阅专栏

本文探讨了神经网络如何解决分类与回归问题，详细解释了恒等函数与softmax函数在不同问题中的作用，以及它们如何影响学习与推理过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

神经网络可以用在分类问题和回归问题上，不过需要根据情况改变输出层的激活函数。一般而言，回归问题用恒等函数，分类问题用 softmax 函数。

机器学习的问题大致可以分为分类问题和回归问题。分类问题是数据属于哪一个类别的问题。比如，区分图像中的人是男性还是女性的问题就是分类问题。而回归问题是根据某个输入预测一个（连续的）数值的问题。比如，根据一个人的图像预测这个人的体重的问题就是回归问题（类似“57.4kg”这样的预测）。

恒等函数会将输入按原样输出，对于输入的信息，不加以任何改动地直接输出。

分类问题中使用的 softmax 函数

首先，上公式：

$y=\frac{exp(a_k)}{\sum^n_{i=1}(exp(a_i))}$

这个函数的变量是一个有n个元素的数组： $\{a_1,a_2,...,a_n\}$ ，其中某一个元素 a_k,k=1,...,n 对应的函数的值等于它自身的指数函数值除以数组中所有元素的指数函数值之和，指数函数为 exp(x) .

其次，上一组图，大概了解一下softmax函数的特点：

Softmax函数(1)，输入a=np.arange(-5.0,5.0,0.1)

Softmax函数（2）输入a=np.arange(-5.0,2.0,0.1)

可以发现softmax函数具有以下特点：a. 不改变输入值的大小关系，输入值在数组中属于比较小的数值的话，其对应的输出也比较小。b. softmax函数的所有输出值之和为1.

机器学习的过程可以分为“学习”和“推理”

我的理解就是：

学习——已知输入，已知输出，确定模型，识别参数（如果你学过控制就很明白这个了，就是参数辨识）

推理——已知输入，已知模型和参数，求输出（验证模型与参数的正确性）

在学习过程中，分类问题使用softmax函数作为输出层的激活函数，但由于分类问题始终把最大值对应的类别作为识别的类别，而softmax函数并不改变输入值的大小关系，因此，在推理过程中，考虑到计算量，直接省略了softmax函数。

博客等级

码龄8年

39
原创

94
点赞

230
收藏

25
粉丝

关注

私信

分类专栏

展开全部收起

上一篇：: 1.3 神经网络内积

下一篇：: 在线下载MNIST数据集（深度学习入门基于Python的理论与实现——源代码）

最新评论

Bellman Equation 贝尔曼方程
eowyn0406: 维基百科，原文地址已经贴在文章最后面了
Bellman Equation 贝尔曼方程
m0_69388475: 关于bellman方程的起源、背景和稳态的意义，作者参考了哪些资料呀，跪求
如何用四元数表示姿态差
eowyn0406: 是为了推导出Y=WX中的W啊，写成另一种形式就是Y=XW了，想写成哪种形式根据您的需求来就好了。
如何用四元数表示姿态差
eowyn0406: 我觉得可能没有实际的物理意义，就理解为从一个姿态变化到另一个姿态的映射就好了。通过距离四元数，可以将第一个姿态的四元数转换为第二个姿态的四元数。或者，理解为三个角度差的模也行。——理解不一定对，仅供参考。
如何用四元数表示姿态差
找不到服务器zhn: 表示两个坐标系的变换，可以看我的推导https://blog.youkuaiyun.com/qq_34288751/article/details/134590957

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。