深度学习之神经网络

无骨鱼学代码

于 2024-05-04 21:40:13 发布

阅读量1.6k

点赞数 34

文章标签：深度学习神经网络人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_55922470/article/details/138444343

版权

本文详细介绍了神经网络的工作原理，包括正向传播、反向传播、损失函数（如交叉熵误差）、权重更新（如随机梯度下降）以及深度学习计算的加速（如CuPy利用GPU）。文章还涉及了关键概念如矩阵乘法、非线性激活函数和梯度计算方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

神经网络分为学习和推理。

神经网络就是将输入变换为输出，类似函数作用。

1 神经网络的推理

结论：箭头有权重，还要加上偏置（不受前一层神经元影响的常数），该图为2层神经网络

结论：其实就是矩阵相乘，注意权重和偏置以及对于维度。

mini-batch：小批量同时对多笔样本数据进行推理和学习。

sigmoid函数：非线性激活函数，增强神经网络的表现力，接收任意大小的实数，输出0~1的实数

例子：

1.1 层的类化及正向传播的实现

正向传播:从输入层到输出层的传播

反向传播：与正向传播相反的顺序传播数据（梯度）

代码规范：

2 神经网络的学习

2.1 损失函数

损失：神经网络学习的指标，基于监督数据（学习阶段获得的正确的数据）和神经网络预测的结果，将模型的恶劣程度作为标量（单一数值）计算出来

交叉熵误差：多类别分类的神经网络的损失函数

softmax函数：

交叉熵误差：

2.2 导数和梯度

神经网络的学习目标是找到损失尽可能小的参数。

其实就是求偏导。

深度学习中的梯度一般定义为关于矩阵和张量的导数。

2.3 链式法则

链式法则就是符合函数求导法则，跟我们高数学得一个意思。

神经网络是由多个函数复合而成的。误差反向传播法会充分利用链式法则来求关于多个函数（神经网络）的梯度。

2.4 计算图

2.4.1 乘法节点

2.4.2 分支节点

分支节点也称为复制节点。

它的反向传播是上游传来的梯度之和。

2.4.5 repeat节点

复制N份，反向传播是N个梯度求和。

2.4.6 sum节点

sum节点是通用加法节点；sum节点的反向传播将上游传来的梯度分配到所有箭头上。

sum节点和repeat节点存在逆向关系。

2.4.7 matmul节点

矩阵乘积

2.5 梯度推导和反向传播的实现

2.5.1 sigmoid层

2.5.2 affine层

通过 y = np.dot(x, W) + b 实现了 Affine 层的正向传播。

通过 MatMul 节点进行矩阵乘积的计算。偏置被 Repeat 节点复制，然后进行加法运算（可以认为 NumPy 的广播功能在内部进行了Repeat 节点的计算）。

2.5.3 softmax with loss 层

Softmax 函数和交叉熵误差一起实现为 Softmax with Loss 层。

Softmax 层对输入 a 1 , a 2 , a 3 进行正规化，输出 y 1 , y 2 , y 3 。 Cross Entropy Error 层接收 Softmax 的输出 y 1 , y 2 , y 3 和监督标签 t 1 , t 2 , t 3 ，并基于这些数据输出损失 L 。

2.6 权重的更新

通过误差反向传播法求出梯度后，就可以使用该梯度更新神经网络的参数。

梯度下降法：将参数向该梯度的反方向更新，可以降低损失。

权重更新方法有很多，这里我们来实现其中最简单的随机梯度下降法（SGD）。

3 使用神经网络解决问题

3.1 螺旋状数据集

3.2 神经网络的实现

已用下面的trainer类便捷实现。

3.3 trainer类

4 计算的高速化

4.1 位精度

NumPy 的浮点数默认使用 64 位的数据类型。

但32为更适用于神经网络推理和学习。所以可以将64位数据指定为32位。

16位不适用与计算等，但保存有用，所以本书仅在保存学习好的权重时，将其变换为 16 位浮点数。

4.2 GUP（CuPy）

深度学习的计算由大量的乘法累加运算组成。这些乘法累加运算的绝大部分可以并行计算，这是 GPU 比 CPU 擅长的地方。

CuPy 是基于 GPU 进行并行计算的库。要使用 CuPy ，需要使用安装有 NVIDIA 的 GPU 的机器，并且需要安装 CUDA 这个面向 GPU 的通用并行计算平台。

CuPy 和 NumPy 拥有共同的 API，CuPy 的使用方法与 NumPy 基本相同。

无骨鱼学代码

博客等级

码龄4年

18
原创

134
点赞

133
收藏

116
粉丝

关注

私信

热门文章

最新评论

深度学习之自然语言处理（Attention）
优快云-Ada助手: 恭喜您撰写了这篇关于深度学习和自然语言处理的博客，特别是探讨了Attention机制。这是一个非常有趣和前沿的话题，您的文章内容详实、逻辑清晰，让读者受益匪浅。希望您能继续坚持创作，探索更多深度学习领域的知识，或许可以考虑加入一些实际案例或应用场景的讨论，以便更好地帮助读者理解和应用所学知识。期待您未来更多优质的分享，加油！
深度学习之神经网络
优快云-Ada助手: 恭喜作者发布了关于“深度学习之神经网络”的第四篇博客！持续创作并分享知识是很有价值的事情，希望作者能够继续保持这种热情和努力。下一步，建议作者可以尝试深入探讨神经网络在不同领域的应用，或者结合实际案例进行分析，这样可以让读者更加深入地了解神经网络的强大之处。期待作者更多精彩的作品！继续加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.youkuaiyun.com/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

大家在看

两段锁协议与触发器详解及代码案例

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。