chapter-4-介绍神经网络

最新推荐文章于 2025-05-28 16:36:08 发布

JachinMa

最新推荐文章于 2025-05-28 16:36:08 发布

阅读量430

点赞数

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/JachinMa/article/details/90216706

本文介绍了神经网络中的反向传播原理，通过计算图解释了如何利用反向传播计算变量梯度，并讨论了简化神经网络的方法。同时，提到了在矩阵运算中遇到的挑战，以及神经网络的生物学灵感与实际算法之间的差距。

反向传播

首先介绍一个概念：计算图。简单来说，计算图是一个函数的可视化表达，如下图：
在这里插入图片描述
其中每个节点代表一个计算。

利用计算图，我们可以很容易地使用反向传播的思想计算每个变量的梯度：
在这里插入图片描述
首先我们在每个运算后定义一个变量来保存其对应的运算结果，如上图的q和f；然后我们从后向前地分别计算每个运算结果对其上一级变量的导数，如df/dq、df/dz、dq/dx；依次这样做，直到到达了计算图的最前面，即输入数据处。此时计算结果对应输入数据的导数，即df/dx时，利用链式求导法则，只需一路将从f到x的路径上的导数相乘即可。

一个稍复杂的例子如下图：
在这里插入图片描述
值得注意的一点是，这里可以聚合几个运算，把它们视作一个运算进行处理。这是因为sigmoid函数的有着非常优美的求导结果。这种处理方式可以简化神经网络，或许也能减少算法的运算时间。

这里举出了一个包含矩阵的计算图计算的例子：
在这里插入图片描述
思路我还是理解的，不过这里矩阵对矩阵的求导没看懂，看了一圈也没有解释清楚的，后续如果实践中遇到这个问题的话还是要找书看一下。

神经网络

课程这里的介绍过于抽象，下面的介绍可能简单些：

https://blog.youkuaiyun.com/JachinMa/article/details/90050136
https://blog.youkuaiyun.com/JachinMa/article/details/90092536

从函数的思想，神经网络就是有一些被层次化的方式在顶层被堆叠在一起的简单的线性函数，进而组合成一个非线性函数。

但要注意，虽然将神经网络与真实的生物神经网络做对比是理解神经网络的一个好方法，但由于生物神经网络的极度复杂性，我们应该认识到目前的神经网络算法离生物神经网络还有着非常远的距离。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。