一个帮助初学者理解深度神经网络内部工作机制的指南

写作动机: 为了使我自己可以更好地理解深度学习,我决定在没有像 TensorFlow 这样的深度学习库的情况下,从零开始构建一个神经网络。我相信,理解神经网络的内部工作原理对任何有追求的数据科学家来说都很重要。
这篇文章包含了我所学到的东西,希望对你们也有用。
什么是神经网络?
大多数介绍神经网络的文章在描述它们时都会与大脑做类比。在不深入研究与大脑类似之处的情况下,我发现将神经网络简单地描述为给定输入映射到期望输出的数学函数更容易理解一些。
神经网络由以下几个部分组成:
- 一个输入层,x
- 任意数量的隐含层
- 一个输出层,ŷ
- 层与层之间的一组权重和偏差,W 和 b
- 每个隐含层中所包含的一个可选的激活函数,σ。在本教程中,我们将使用 Sigmoid 激活函数。
下图展示了 2 层神经网络的架构(注:在计算神经网络中的层数时,输入层通常被排除在外)

2 层神经网络的架构
在 Python 中创建一个神经网络的类很简单。
class NeuralNetwork:
def __init__(self, x, y):
self.input = x
self.weights1 = np.random.rand(self.input.shape[1],4)
self.weights2 = np.random.rand(4,1)
self.y = y
self.output = np.zeros(y.shape)
训练神经网络
一个简单的 2 层神经网络的输出 *ŷ* 如下:

本文旨在帮助初学者理解神经网络的工作机制,作者在没有依赖深度学习库的情况下,详细介绍了神经网络的前馈过程、损失函数和反向传播,并通过Python实现了一个简单的2层神经网络。通过实例演示了神经网络的训练过程,强调了理解神经网络内部工作原理的重要性。
最低0.47元/天 解锁文章
6672

被折叠的 条评论
为什么被折叠?



