31、从零实现多层人工神经网络及TensorFlow并行训练

从零实现多层人工神经网络及TensorFlow并行训练

多层人工神经网络的实现与理解

在图像分类任务中,我们可以看到一些图像即使对于人类来说正确分类也具有挑战性。例如,子图8中的数字6看起来像随手画的0,子图23中的数字8由于下部较窄且线条较粗,可能会被误认为是9。

计算逻辑斯谛成本函数

逻辑斯谛成本函数在多层人工神经网络中非常重要。最初的逻辑斯谛成本函数公式为:
[J(w) = -\sum_{i=1}^{n}[y^{[i]}\log(a^{[i]}) + (1 - y^{[i]})\log(1 - a^{[i]})]]
其中,(a^{[i]}) 是数据集中第 (i) 个样本的Sigmoid激活值,通过前向传播步骤计算得出:(a^{[i]} = \phi(z^{[i]})) 。这里的上标 ([i]) 是训练示例的索引,而非层的索引。

为了减少过拟合程度,我们添加L2正则化项。L2正则化项定义为:
[L2 = \lambda|\boldsymbol{w}|^{2} {2} = \lambda\sum {j=1}^{m}w_{j}^{2}]
将L2正则化项添加到逻辑斯谛成本函数后,得到:
[J(w) = -\left[\sum_{i=1}^{n}y^{[i]}\log(a^{[i]}) + (1 - y^{[i]})\log(1 - a^{[i]})\right] + \frac{\lambda}{2}|\boldsymbol{w}|^{2}_{2}]

对于多分类的多层感知器(MLP),我们需要将逻辑斯谛成本函数推广到网络中的所有激活单元。不包含正则化项的成本函数变为:

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值