11、深度神经网络中的线性与非线性:原理、实现与应用

深度神经网络中的线性与非线性:原理、实现与应用

1. 线性与非线性概念引入

在神经网络的学习中,线性与非线性是一个较为复杂的概念。为了让神经网络能够正常训练,我们需要引入一个关键要素。从简单的代数运算来看,比如 1 * 10 * 2 = 100 5 * 20 = 100 1 * 0.25 * 0.9 = 0.225 1 * 0.225 = 0.225 ,可以发现任意两次乘法运算的结果,都可以通过一次乘法来实现。

这一现象在神经网络中却带来了问题。对于任何一个三层神经网络,都存在一个与之行为相同的两层神经网络。也就是说,堆叠两层目前所了解的神经网络,并不能带来更多的能力提升,两次连续的加权求和只是一次加权求和的更复杂版本。

2. 神经网络无法正常工作的原因

如果直接训练当前的三层神经网络,它无法收敛。问题在于,对于输入的任意两次连续加权求和,都存在一个与之行为完全相同的单次加权求和。三层神经网络能做的事情,两层神经网络也能做到。

以中间层(layer_1)为例,在未进行改进之前,中间层的每个节点都与输入节点存在一定的权重连接。从相关性的角度来看,中间层的每个节点与每个输入节点都有一定程度的相关性。如果输入到中间层的权重为 1.0,那么中间层节点会完全跟随输入节点的变化;如果权重为 0.5,则中间层节点会跟随输入节点 50% 的变化。

中间层节点想要摆脱与某个特定输入节点的相关性,只能通过增加与其他输入节点的相关性。但在新的数据集中,输入和输出之间没有相关性,所以中间层只是将原本无用的相关性

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值