关于神经网络中的代价函数——交叉熵的由来

最新推荐文章于 2025-07-05 10:11:49 发布

原创

最新推荐文章于 2025-07-05 10:11:49 发布 · 1.4w 阅读

·

16

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#神经网络 #代价函数 #交叉熵 #机器学习 #cost function

这段时间一直在看有关于神经网络的教程，在之前看过的其他一些机器学习算法，例如logistics回归等都是用C =(y− a)²/2函数做cost function，但是在神经网络算法中，有些教程是使用交叉熵作为代价函数的（关于斯坦福大学的深度学习教程依旧使用的是C =(y− a)²/2函数做cost function），这个让我很郁闷，于是我就问了师兄，然后没有然后。。。没有搞懂。我就在网上找了些讲解资料，写得都OK可是都没有深入的阐述一下几个问题：

a、为什么使用交叉熵，二次代价函数不好吗（毕竟斯坦福的深度学习教程就是用的二次代价函数）？

b、交叉熵为什么可以作为cost function？这个想法来自于哪里？？？

在我看完神经网络与深度学习之后，这些问题迎刃而解了。下面对于以上几个问题进行详细的解答。

二次代价函数的缺陷

理想情况下，我们都希望和期待神经网络可以从错误中快速地学习，但是在实践过程中并不是很理想。在使用函数C =(y− a)²/2表示的二次代价函数，假设a是神经元的输入，训练输入为x = 1, y = 0为目标输出。使用权重和偏置来表达这个，有a = σ(z)，其中z = wx + b。使用链式法则来求权重和偏置的偏导数得：

其中已经将x = 1和y = 0代入。最后权重和偏置的偏导数只与σ′(

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄9年

3
原创

20
点赞

19
收藏

5
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 卷积神经网络介绍

下一篇：: 关于新手如何使用Git上传项目代码到github

最新评论

关于神经网络中的代价函数——交叉熵的由来
苦涩柠檬香回复 baidu_36311237: x和n其实是一个数，别被这里误导了
关于神经网络中的代价函数——交叉熵的由来
qq_25448087: 你好，cross_entropy = tf.reduce_sum(labels * tf.log(labels/predicts), axis=1)结果交叉熵是个向量，维度等于样本个数，以往的认知一直认为交叉熵结果应是个数，代码出自https://zhuanlan.zhihu.com/p/27842203。
关于神经网络中的代价函数——交叉熵的由来
qq_25448087: cross_entropy = tf.reduce_sum(labels * tf.log(labels/predicts), axis=1),交叉熵结果是个向量，该向量维度等于样本个数，这又怎么理解呢？之前的认知一直认为交叉熵结果应该是个数。该代码出处https://zhuanlan.zhihu.com/p/27842203
关于神经网络中的代价函数——交叉熵的由来
adong76: 多谢楼主，写的很详细
卷积神经网络介绍
ydncw: max-pooling不是池化层吗，，

大家在看

告别边界条件噩梦！双向循环链表（哨兵位）实现技巧与避坑指南 972

最新文章

目录

展开全部

收起

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。