31、从零实现多层人工神经网络及TensorFlow并行训练

最新推荐文章于 2025-10-29 12:56:04 发布

js777

最新推荐文章于 2025-10-29 12:56:04 发布

阅读量14

点赞数

CC 4.0 BY-SA版权

分类专栏：掌握机器学习核心技能文章标签：多层人工神经网络反向传播算法逻辑斯谛成本函数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/js777/article/details/154923317

掌握机器学习核心技能专栏收录该内容

53 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

从零实现多层人工神经网络及TensorFlow并行训练

多层人工神经网络的实现与理解

在图像分类任务中，我们可以看到一些图像即使对于人类来说正确分类也具有挑战性。例如，子图8中的数字6看起来像随手画的0，子图23中的数字8由于下部较窄且线条较粗，可能会被误认为是9。

计算逻辑斯谛成本函数

逻辑斯谛成本函数在多层人工神经网络中非常重要。最初的逻辑斯谛成本函数公式为：
[J(w) = -\sum_{i=1}^{n}[y^{[i]}\log(a^{[i]}) + (1 - y^{[i]})\log(1 - a^{[i]})]]
其中，(a^{[i]}) 是数据集中第 (i) 个样本的Sigmoid激活值，通过前向传播步骤计算得出：(a^{[i]} = \phi(z^{[i]})) 。这里的上标 ([i]) 是训练示例的索引，而非层的索引。

为了减少过拟合程度，我们添加L2正则化项。L2正则化项定义为：
[L2 = \lambda|\boldsymbol{w}|^{2} {2} = \lambda\sum {j=1}^{m}w_{j}^{2}]
将L2正则化项添加到逻辑斯谛成本函数后，得到：
[J(w) = -\left[\sum_{i=1}^{n}y^{[i]}\log(a^{[i]}) + (1 - y^{[i]})\log(1 - a^{[i]})\right] + \frac{\lambda}{2}|\boldsymbol{w}|^{2}_{2}]

对于多分类的多层感知器（MLP），我们需要将逻辑斯谛成本函数推广到网络中的所有激活单元。不包含正则化项的成本函数变为：

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。