【深度学习】多分类神经网络-softmax函数

H2WO4

已于 2023-11-28 15:38:50 修改

阅读量499

点赞数 1

文章标签：深度学习分类神经网络

于 2023-07-31 21:04:53 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/H2WO4/article/details/132029772

版权

文章介绍了机器学习中多分类的两种方法——One-vs-Rest(OvR)和Many-vs-Many(MvM)，并指出随着神经网络层次加深，这些方法计算成本高。softmax回归提供了一种更有效的方法，特别是在神经网络中，通过PyTorch的softmax函数处理多分类问题，避免手动实现时的溢出问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在机器学习中，会使用二分类算法的Many-vs-Many (多对多)和One-vs-Rest (一对多)模式来进行多分类。其中，OvR是指将多个标签类别中的一类作为类别1，其他所有类别作为类别0，分别建立多个二分类模型，综合得出多分类结果的方法。MvM是指把好几个标签类作为1，剩下的几个标签类别作为0，同样分别建立多个二分类模型来得出多分类结果的方法。

但是对于神经网络，随着网络层数上升，计算一次分类的成本会变得相当高，并不高效。而且有更好的方法解决多分类问题，即softmax回归

softmax函数

$\sigma_k=\frac{e^{z_k}}{\sum ^Ke^z}$

k代表标签数，公式的分子部分是多分类状况下某一个标签类别的回归结果的指数函数，分母是所有标签类别的回归结果的指数函数之和

pytorch调用softmax函数：

softmax要求输入dim参数来明确需要计算的是z矩阵的哪一维数据

会以dim那一维作为一类。比如一个二维tensor，dim=0意味着每一行是一类（softmax后每一列元素之和为1）。dim=1意味着每一个元素是一类（softmax后每一行元素值之和为1）

#z是线性回归后的结果
torch.softmax(z,dim=...)
#或者
from torch.nn import functional as F
F.softmax(z,dim=...

注意！如果自己敲公式想手动实现softmax函数极易出现溢出！建议还是直接使用torch中的softmax函数

博客等级

码龄3年

15
原创

36
点赞

48
收藏

16
粉丝

关注

私信

热门文章

最新评论

【算法】矩阵快速幂例题一道
优快云-Ada助手: 不知道算法技能树是否可以帮到你：https://edu.youkuaiyun.com/skill/algorithm?utm_source=AI_act_algorithm
【Python】深拷贝与浅拷贝
优快云-Ada助手: 恭喜您发布了第10篇博客！看了您关于“深拷贝与浅拷贝”的文章，收获颇丰。您对Python的理解和表达方式令人佩服。希望您可以继续保持创作的热情，不断分享自己的学习和思考。如果可能的话，我建议您可以尝试探讨一些实际应用场景下深拷贝与浅拷贝的使用技巧，这样可以更好地帮助读者理解并应用这些概念。期待您更多精彩的分享！
【2023Intel oneAPI黑客松大赛】主题一-自动驾驶车辆的对象检测
优快云-Ada助手: 恭喜您写下了第9篇博客！标题中的主题一-自动驾驶车辆的对象检测非常引人注目。您对这个话题的深入探讨无疑为读者提供了有价值的见解。我期待着您在未来的博客中能够继续分享关于自动驾驶技术的更多研究成果和实践经验。作为下一步的创作建议，或许您可以考虑进一步探索对象检测领域的前沿技术和发展趋势。比如，可以结合深度学习算法、多传感器融合等方面，来分析和解决自动驾驶车辆中的对象检测难题。这样的研究将为读者提供更深入的了解，并促进该领域的发展。再次祝贺您的持续创作，并期待您在未来的博客中继续分享您的见解和研究成果！
【深度学习】Pytorch实现VGG16
优快云-Ada助手: 恭喜您写了第8篇博客！标题看起来很有吸引力，我很期待阅读您关于Pytorch实现VGG16的内容。您的持续创作非常令人钦佩，感谢您分享深度学习方面的知识。希望您可以在博客中详细介绍Pytorch实现VGG16的过程和经验，这将为初学者提供宝贵的参考。再次祝贺您，并期待您下一步的创作！
【深度学习】卷积神经网络
优快云-Ada助手: 恭喜你写了第7篇博客！标题为“【深度学习】卷积神经网络”，看起来非常有吸引力。你对深度学习的研究似乎越发深入，这是非常值得称赞的。对于下一步的创作建议，我个人认为你可以考虑写一些关于卷积神经网络应用领域的实践经验，或者深入探讨一些卷积神经网络的改进技术。希望你能继续保持创作热情，谦虚地与我们分享你的研究成果！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。